Resultados da pesquisa a pedido "nlp"
Stanford NER no NLTK não codifica várias frases corretamente - Python
Eu tenho uma função que retorna as entidades nomeadas em um determinado corpo de texto, usando o NER de Stanford. def get_named_entities(text): load_ner_files() print text[:100] # to show that the text is fine text_split = text.split() print ...
Contar com eficiência as frequências de palavras em python
Eu gostaria de contar as frequências de todas as palavras em um arquivo de texto. >>> countInFile('test.txt')deve retornar{'aaa':1, 'bbb': 2, 'ccc':1} se o arquivo de texto de destino for como: # test.txt aaa bbb ccc bbbEu o implementei com ...
Gensim word2vec em dados de dicionário e índices de palavras predefinidos
Preciso treinar uma representação word2vec em tweets usando gensim. Ao contrário da maioria dos tutoriais e códigos que eu já vi no gensim, meus dados não são brutos, mas já foram pré-processados. Eu tenho um dicionário em um documento de texto ...
Como extrair frases do corpus usando gensim
Para pré-processar o corpus, planejava extrair frases comuns do corpus, por isso tentei usarFrasesmodelo em gensim, tentei abaixo do código, mas não está me dando a saída desejada. Meu código from gensim.models import Phrases documents = ["the ...
O analisador de malte fornece erro de asserção ao usá-lo com o nltk
Estou usando o analisador de malte com python nltk. Fiz o download dos dados do treinamento e atualizei o nltk mais recente. Quando eu chamo o analisador de malte, ocorre um erro de aserção. Abaixo está o código do python, que também inclui o ...
É possível treinar novamente um modelo word2vec (por exemplo, GoogleNews-vectors-negative300.bin) a partir de um corpus de frases em python?
Estou usando o conjunto de dados de notícias do Google pré-treinado para obter vetores de palavras usando a biblioteca Gensim em python model = Word2Vec.load_word2vec_format('GoogleNews-vectors-negative300.bin', binary=True)Depois de carregar o ...
Por onde começar: Processamento de linguagem natural e IA usando Python
Meu objetivo é escrever um programa capaz de extrair tom, personalidade e intenção das perguntas da linguagem humana (por exemplo, eu digito: Como você está hoje? E o sistema de IA responde com algo como: Bem. Como está?) Estou ciente de que ...
corresponder à tag POS e sequência de palavras
Eu tenho as seguintes duas strings com suas tags POS: Sent1: "algo como o trabalho do escritor profissional ou fraseologia seria muito legal." [('something', 'NN'), ('like', 'IN'), ('how', 'WRB'), ('writer', 'NN'), ('pro', 'NN') , ('ou', 'CC'), ...
Instalando o coreNLP no R
Estou seguindo as instruções neste link para usar o coreNLP https://github.com/statsmaths/coreNLP [https://github.com/statsmaths/coreNLP] No entanto, encontrei este erro > library(coreNLP) Error in get(method, envir = home) : lazy-load ...
detecção de padrão de tag POS junto com palavras especificadas
Preciso identificar determinadas tags POS antes / depois de certas palavras especificadas, por exemplo, a seguinte frase com tag: [('This', 'DT'), ('feature', 'NN'), ('would', 'MD'), ('be', 'VB'), ('nice', 'JJ'), ('to', 'TO'), ('have', ...