Resultados da pesquisa a pedido "nlp"
Como codificar frases quentes no nível do caractere?
Eu gostaria de converter uma frase em uma matriz de vetor quente. Esse vetor seria a representação quente do alfabeto. Seria o seguinte: "hello" # h=7, e=4 l=11 o=14se tornaria [[0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ...
Interpretando a soma das pontuações de palavras do TF-IDF nos documentos
Primeiro, vamos extrair as pontuações do TF-IDF por termo por documento: from gensim import corpora, models, similarities documents = ["Human machine interface for lab abc computer applications", "A survey of user opinion of computer system ...
Qual é a conexão ou diferença entre lema e synset no wordnet?
Eu sou um iniciante completo em PNL e NLTK. Não consegui entender exatamentediferença entre lemas e sincronizações no wordnet, porque ambos estão produzindo quase a mesma saída. por exemplo, para a palavra bolo, ela produz essa saída. lemmas : ...
Maneira rápida de dividir uma sequência de palavras unida em palavras individuais
Digamos que eu tenha essa string: hellohowareyouExiste uma maneira rápida de separar isso em palavras individuais, para que o resultado final sejahello how are you? Eu posso pensar em várias maneiras, mas elas seriam extremamente lentas ...
Adicione / remova palavras de parada com spacy
Qual é a melhor maneira de adicionar / remover palavras de parada com spacy? estou usandotoken.is_stop [https://spacy.io/docs/api/token]função e gostaria de fazer algumas alterações personalizadas no conjunto. Eu estava olhando a documentação, ...
Como o gensim calcula vetores de parágrafos doc2vec
eu estou indo através deste artigo http://cs.stanford.edu/~quocle/paragraph_vector.pdf [http://cs.stanford.edu/~quocle/paragraph_vector.pdf] e afirma que "O vetor de parágrafo e os vetores de palavras são calculados em média ou concatenados ...
Como é calculada a pontuação de polaridade 'composta' de Vader no Python NLTK?
Estou usando o Vader SentimentAnalyzer para obter as pontuações de polaridade. Eu usei as pontuações de probabilidade para positivo / negativo / neutro antes, mas percebi que a pontuação "composta", variando de -1 (mais neg) a 1 (mais ...
Números binários em vez de um vetores quentes
Ao fazer a regressão logística, é prática comum usar um vetor quente como resultado desejado. Assim,no of classes = no of nodes in output layer. Não usamos índice de palavras no vocabulário (ou um número de classe em geral) porque isso pode ...
Resolução de Coreference em python nltk usando Stanford coreNLP
Stanford CoreNLP fornece resolução de coreferencecomo mencionado aqui [http://nlp.stanford.edu/software/dcoref.shtml], Além dissoesta discussão [https://stackoverflow.com/questions/30954649/coreference-resolution-using-stanford-corenlp] , ...
Convertendo saída de análise de dependência em árvore
estou usandoStanford dependency parser e eu recebo a seguinte saída da frase Eu atirei em um elefante no meu sono python dep_parsing.py [((u'shot', u'VBD'), u'nsubj', (u'I', u'PRP')), ((u'shot', u'VBD'), u'dobj', (u'elephant', u'NN')), ...