Resultados da pesquisa a pedido "nlp"

2 a resposta

Stanford NER no NLTK não codifica várias frases corretamente - Python

Eu tenho uma função que retorna as entidades nomeadas em um determinado corpo de texto, usando o NER de Stanford. def get_named_entities(text): load_ner_files() print text[:100] # to show that the text is fine text_split = text.split() print ...

7 a resposta

Contar com eficiência as frequências de palavras em python

Eu gostaria de contar as frequências de todas as palavras em um arquivo de texto. >>> countInFile('test.txt')deve retornar{'aaa':1, 'bbb': 2, 'ccc':1} se o arquivo de texto de destino for como: # test.txt aaa bbb ccc bbbEu o implementei com ...

2 a resposta

Gensim word2vec em dados de dicionário e índices de palavras predefinidos

Preciso treinar uma representação word2vec em tweets usando gensim. Ao contrário da maioria dos tutoriais e códigos que eu já vi no gensim, meus dados não são brutos, mas já foram pré-processados. Eu tenho um dicionário em um documento de texto ...

1 a resposta

Como extrair frases do corpus usando gensim

Para pré-processar o corpus, planejava extrair frases comuns do corpus, por isso tentei usarFrasesmodelo em gensim, tentei abaixo do código, mas não está me dando a saída desejada. Meu código from gensim.models import Phrases documents = ["the ...

2 a resposta

O analisador de malte fornece erro de asserção ao usá-lo com o nltk

Estou usando o analisador de malte com python nltk. Fiz o download dos dados do treinamento e atualizei o nltk mais recente. Quando eu chamo o analisador de malte, ocorre um erro de aserção. Abaixo está o código do python, que também inclui o ...

3 a resposta

É possível treinar novamente um modelo word2vec (por exemplo, GoogleNews-vectors-negative300.bin) a partir de um corpus de frases em python?

Estou usando o conjunto de dados de notícias do Google pré-treinado para obter vetores de palavras usando a biblioteca Gensim em python model = Word2Vec.load_word2vec_format('GoogleNews-vectors-negative300.bin', binary=True)Depois de carregar o ...

2 a resposta

Por onde começar: Processamento de linguagem natural e IA usando Python

Meu objetivo é escrever um programa capaz de extrair tom, personalidade e intenção das perguntas da linguagem humana (por exemplo, eu digito: Como você está hoje? E o sistema de IA responde com algo como: Bem. Como está?) Estou ciente de que ...

5 a resposta

corresponder à tag POS e sequência de palavras

Eu tenho as seguintes duas strings com suas tags POS: Sent1: "algo como o trabalho do escritor profissional ou fraseologia seria muito legal." [('something', 'NN'), ('like', 'IN'), ('how', 'WRB'), ('writer', 'NN'), ('pro', 'NN') , ('ou', 'CC'), ...

2 a resposta

Instalando o coreNLP no R

Estou seguindo as instruções neste link para usar o coreNLP https://github.com/statsmaths/coreNLP [https://github.com/statsmaths/coreNLP] No entanto, encontrei este erro > library(coreNLP) Error in get(method, envir = home) : lazy-load ...

1 a resposta

detecção de padrão de tag POS junto com palavras especificadas

Preciso identificar determinadas tags POS antes / depois de certas palavras especificadas, por exemplo, a seguinte frase com tag: [('This', 'DT'), ('feature', 'NN'), ('would', 'MD'), ('be', 'VB'), ('nice', 'JJ'), ('to', 'TO'), ('have', ...