Resultados da pesquisa a pedido "nltk"
AttributeError: o objeto 'FreqDist' não tem atributo 'inc'
Eu sou iniciante em Python e NLTK. Estou tentando executar o seguinte código em um tutorial: from nltk.corpus import gutenberg from nltk import FreqDist fd = FreqDist() for word in gutenberg.words('austen-sense.txt'): fd.inc(word)Se eu executar ...
Estrutura de dados da árvore NLTK, localizando um nó, pai ou filhos
Estou usando a estrutura de dados em árvore do nltk para trabalhar com seqüências de caracteres parsetree. from nltk.tree import Tree parsed = Tree('(ROOT (S (NP (PRP It)) (VP (VBZ is) (ADJP (RB so) (JJ nice))) (. .)))')A estrutura de dados, no ...
Extraindo tuplas com nltk?
Ao ler a documentação do nltk, descobri que é possível extrair tuplas comstr2tuple(). Por exemplo, suponho que tenho a seguinte frase (claramente é um arquivo muito maior): sent = "pero pero CC " \ "tan tan RG " \ "antigua antiguo AQ0FS0 " \ ...
sklearn: Como acelerar um vetorizador (por exemplo, Tfidfvectorizer)
Depois de traçar um perfil completo do meu programa, consegui identificar que ele está sendo retardado pelo vetorizador. Estou trabalhando com dados de texto e duas linhas de vetorização simples de unigrama tfidf estão ocupando 99,2% do tempo ...
Determinando Hypernym ou Hyponym usando o wordnet nltk
Eu quero verificar a relação hypernyms / hiponímia entre duas palavras (fornecida pelo usuário), o que significa que qualquer uma delas pode ser hypernym de outra ou também pode ser o caso de não haver relação hypernym entre as duas.Posso usar ...
Erro python NLTK: “TypeError: o objeto 'dict_keys' não é subscrito”
Estou seguindo as instruções para um trabalho de casa e devo procurar as 200 palavras mais usadas em um arquivo de texto. Aqui está a última parte do código: fdist1 = FreqDist(NSmyText) vocab=fdist1.keys() vocab[:200]Mas quando eu pressiono ...
Recurso u'tokenizers / punkt / english.pickle 'não encontrado
Meu Código: import nltk.data tokenizer = nltk.data.load('nltk:tokenizers/punkt/english.pickle')Mensagem de erro: [ec2-user@ip-172-31-31-31 sentiment]$ python mapper_local_v1.0.py Traceback (most recent call last): File "mapper_local_v1.0.py", ...
geração de tags a partir de um conteúdo de texto
Estou curioso para saber se existe um algoritmo / método para gerar palavras-chave / tags de um determinado texto, usando alguns cálculos de peso, taxa de ocorrência ou outras ferramentas. Além disso, ficarei grato se você apontar qualquer ...
Falha no NLTK e nas palavras-chave #lookuperror
Estou tentando iniciar um projeto de análise de sentimentos e usarei o método stop words. Fiz algumas pesquisas e descobri que o nltk tem palavras irrelevantes, mas quando executo o comando, ocorre um erro. O que faço é o seguinte, para saber ...
Python NLTK: SyntaxError: caractere não ASCII '\ xc3' no arquivo (Senitment Analysis -NLP)
Estou brincando com o NLTK para fazer uma tarefa na análise de sentimentos. Estou usando o Python 2.7. NLTK 3.0 e NUMPY 1.9.1 versão. Este é o código: __author__ = 'karan' import nltk import re import sys def main(): print("Start"); # getting ...