Resultados da pesquisa a pedido "nlp"

5 a resposta

Como codificar frases quentes no nível do caractere?

Eu gostaria de converter uma frase em uma matriz de vetor quente. Esse vetor seria a representação quente do alfabeto. Seria o seguinte: "hello" # h=7, e=4 l=11 o=14se tornaria [[0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ...

4 a resposta

Interpretando a soma das pontuações de palavras do TF-IDF nos documentos

Primeiro, vamos extrair as pontuações do TF-IDF por termo por documento: from gensim import corpora, models, similarities documents = ["Human machine interface for lab abc computer applications", "A survey of user opinion of computer system ...

2 a resposta

Qual é a conexão ou diferença entre lema e synset no wordnet?

Eu sou um iniciante completo em PNL e NLTK. Não consegui entender exatamentediferença entre lemas e sincronizações no wordnet, porque ambos estão produzindo quase a mesma saída. por exemplo, para a palavra bolo, ela produz essa saída. lemmas : ...

3 a resposta

Maneira rápida de dividir uma sequência de palavras unida em palavras individuais

Digamos que eu tenha essa string: hellohowareyouExiste uma maneira rápida de separar isso em palavras individuais, para que o resultado final sejahello how are you? Eu posso pensar em várias maneiras, mas elas seriam extremamente lentas ...

4 a resposta

Adicione / remova palavras de parada com spacy

Qual é a melhor maneira de adicionar / remover palavras de parada com spacy? estou usandotoken.is_stop [https://spacy.io/docs/api/token]função e gostaria de fazer algumas alterações personalizadas no conjunto. Eu estava olhando a documentação, ...

2 a resposta

Como o gensim calcula vetores de parágrafos doc2vec

eu estou indo através deste artigo http://cs.stanford.edu/~quocle/paragraph_vector.pdf [http://cs.stanford.edu/~quocle/paragraph_vector.pdf] e afirma que "O vetor de parágrafo e os vetores de palavras são calculados em média ou concatenados ...

1 a resposta

Como é calculada a pontuação de polaridade 'composta' de Vader no Python NLTK?

Estou usando o Vader SentimentAnalyzer para obter as pontuações de polaridade. Eu usei as pontuações de probabilidade para positivo / negativo / neutro antes, mas percebi que a pontuação "composta", variando de -1 (mais neg) a 1 (mais ...

2 a resposta

Números binários em vez de um vetores quentes

Ao fazer a regressão logística, é prática comum usar um vetor quente como resultado desejado. Assim,no of classes = no of nodes in output layer. Não usamos índice de palavras no vocabulário (ou um número de classe em geral) porque isso pode ...

3 a resposta

Resolução de Coreference em python nltk usando Stanford coreNLP

Stanford CoreNLP fornece resolução de coreferencecomo mencionado aqui [http://nlp.stanford.edu/software/dcoref.shtml], Além dissoesta discussão [https://stackoverflow.com/questions/30954649/coreference-resolution-using-stanford-corenlp] , ...

1 a resposta

Convertendo saída de análise de dependência em árvore

estou usandoStanford dependency parser e eu recebo a seguinte saída da frase Eu atirei em um elefante no meu sono python dep_parsing.py [((u'shot', u'VBD'), u'nsubj', (u'I', u'PRP')), ((u'shot', u'VBD'), u'dobj', (u'elephant', u'NN')), ...