Resultados da pesquisa a pedido "nltk"

4 a resposta

AttributeError: o objeto 'FreqDist' não tem atributo 'inc'

Eu sou iniciante em Python e NLTK. Estou tentando executar o seguinte código em um tutorial: from nltk.corpus import gutenberg from nltk import FreqDist fd = FreqDist() for word in gutenberg.words('austen-sense.txt'): fd.inc(word)Se eu executar ...

1 a resposta

Estrutura de dados da árvore NLTK, localizando um nó, pai ou filhos

Estou usando a estrutura de dados em árvore do nltk para trabalhar com seqüências de caracteres parsetree. from nltk.tree import Tree parsed = Tree('(ROOT (S (NP (PRP It)) (VP (VBZ is) (ADJP (RB so) (JJ nice))) (. .)))')A estrutura de dados, no ...

2 a resposta

Extraindo tuplas com nltk?

Ao ler a documentação do nltk, descobri que é possível extrair tuplas comstr2tuple(). Por exemplo, suponho que tenho a seguinte frase (claramente é um arquivo muito maior): sent = "pero pero CC " \ "tan tan RG " \ "antigua antiguo AQ0FS0 " \ ...

1 a resposta

sklearn: Como acelerar um vetorizador (por exemplo, Tfidfvectorizer)

Depois de traçar um perfil completo do meu programa, consegui identificar que ele está sendo retardado pelo vetorizador. Estou trabalhando com dados de texto e duas linhas de vetorização simples de unigrama tfidf estão ocupando 99,2% do tempo ...

1 a resposta

Determinando Hypernym ou Hyponym usando o wordnet nltk

Eu quero verificar a relação hypernyms / hiponímia entre duas palavras (fornecida pelo usuário), o que significa que qualquer uma delas pode ser hypernym de outra ou também pode ser o caso de não haver relação hypernym entre as duas.Posso usar ...

5 a resposta

Erro python NLTK: “TypeError: o objeto 'dict_keys' não é subscrito”

Estou seguindo as instruções para um trabalho de casa e devo procurar as 200 palavras mais usadas em um arquivo de texto. Aqui está a última parte do código: fdist1 = FreqDist(NSmyText) vocab=fdist1.keys() vocab[:200]Mas quando eu pressiono ...

13 a resposta

Recurso u'tokenizers / punkt / english.pickle 'não encontrado

Meu Código: import nltk.data tokenizer = nltk.data.load('nltk:tokenizers/punkt/english.pickle')Mensagem de erro: [ec2-user@ip-172-31-31-31 sentiment]$ python mapper_local_v1.0.py Traceback (most recent call last): File "mapper_local_v1.0.py", ...

4 a resposta

geração de tags a partir de um conteúdo de texto

Estou curioso para saber se existe um algoritmo / método para gerar palavras-chave / tags de um determinado texto, usando alguns cálculos de peso, taxa de ocorrência ou outras ferramentas. Além disso, ficarei grato se você apontar qualquer ...

4 a resposta

Falha no NLTK e nas palavras-chave #lookuperror

Estou tentando iniciar um projeto de análise de sentimentos e usarei o método stop words. Fiz algumas pesquisas e descobri que o nltk tem palavras irrelevantes, mas quando executo o comando, ocorre um erro. O que faço é o seguinte, para saber ...

1 a resposta

Python NLTK: SyntaxError: caractere não ASCII '\ xc3' no arquivo (Senitment Analysis -NLP)

Estou brincando com o NLTK para fazer uma tarefa na análise de sentimentos. Estou usando o Python 2.7. NLTK 3.0 e NUMPY 1.9.1 versão. Este é o código: __author__ = 'karan' import nltk import re import sys def main(): print("Start"); # getting ...