Resultados da pesquisa a pedido "nlp"

2 a resposta

O analisador de malte fornece erro de asserção ao usá-lo com o nltk

Estou usando o analisador de malte com python nltk. Fiz o download dos dados do treinamento e atualizei o nltk mais recente. Quando eu chamo o analisador de malte, ocorre um erro de aserção. Abaixo está o código do python, que também inclui o ...

1 a resposta

Como extrair frases do corpus usando gensim

Para pré-processar o corpus, planejava extrair frases comuns do corpus, por isso tentei usarFrasesmodelo em gensim, tentei abaixo do código, mas não está me dando a saída desejada. Meu código from gensim.models import Phrases documents = ["the ...

2 a resposta

Gensim word2vec em dados de dicionário e índices de palavras predefinidos

Preciso treinar uma representação word2vec em tweets usando gensim. Ao contrário da maioria dos tutoriais e códigos que eu já vi no gensim, meus dados não são brutos, mas já foram pré-processados. Eu tenho um dicionário em um documento de texto ...

3 a resposta

Como descobrir se uma frase é uma pergunta (interrogativa)?

Existe uma biblioteca / algoritmo Java de código aberto para descobrir se uma parte específica do texto é uma pergunta ou não? Estou trabalhando em um sistema de resposta a perguntas que precisa analisar se a entrada de texto pelo usuário é uma ...

7 a resposta

Contar com eficiência as frequências de palavras em python

Eu gostaria de contar as frequências de todas as palavras em um arquivo de texto. >>> countInFile('test.txt')deve retornar{'aaa':1, 'bbb': 2, 'ccc':1} se o arquivo de texto de destino for como: # test.txt aaa bbb ccc bbbEu o implementei com ...

2 a resposta

Stanford NER no NLTK não codifica várias frases corretamente - Python

Eu tenho uma função que retorna as entidades nomeadas em um determinado corpo de texto, usando o NER de Stanford. def get_named_entities(text): load_ner_files() print text[:100] # to show that the text is fine text_split = text.split() print ...

4 a resposta

Mudando as palavras mantendo seu significado intacto [fechado]

Temos um requisito no qual precisamos alterar as palavras ou frases da frase, mantendo intacto o significado. Este aplicativo fornecerá sugestões aos usuários envolvidos na cópia e gravação. Não sei por onde devo começar ... ainda não ...

2 a resposta

Como manter os marcadores de início e fim de frase com quanteda

Estou tentando criar 3 gramas usando R'squanteda pacote. Estou lutando para encontrar uma maneira de manter os marcadores de começo e fim de frase em n gramas, o<s> e</s> como no código abaixo. Eu pensei que usando okeptFeatures com uma ...

1 a resposta

Como encontrar a frequência ngram de uma coluna em um dataframe de pandas?

Abaixo está o quadro de dados de entrada dos pandas que tenho. [/imgs/ltSrD.png] Quero encontrar a frequência de unigramas e bigrams. Uma amostra do que eu estou esperando é mostrada abaixo [/imgs/7NOKk.png] Como fazer isso usando o nltk ou o ...

7 a resposta

Geração de N-grama de, uma frase

Como gerar um n-grama de uma string como: String Input="This is my car."Eu quero gerar n-grama com esta entrada: Input Ngram size = 3A saída deve ser: This is my car This is is my my car This is my is my carDê uma idéia em Java, como ...