Resultados da pesquisa a pedido "nltk"

1 a resposta

Diferença entre as coleções do Python.Counter e nltk.probability.FreqDist

Quero calcular as frequências dos termos das palavras em um corpus de texto. Estou usando o word_tokenize do NLTK seguido de probability.FreqDist há algum tempo para fazer isso. O word_tokenize retorna uma lista, que é convertida em uma ...

1 a resposta

detecção de padrão de tag POS junto com palavras especificadas

Preciso identificar determinadas tags POS antes / depois de certas palavras especificadas, por exemplo, a seguinte frase com tag: [('This', 'DT'), ('feature', 'NN'), ('would', 'MD'), ('be', 'VB'), ('nice', 'JJ'), ('to', 'TO'), ('have', ...

5 a resposta

corresponder à tag POS e sequência de palavras

Eu tenho as seguintes duas strings com suas tags POS: Sent1: "algo como o trabalho do escritor profissional ou fraseologia seria muito legal." [('something', 'NN'), ('like', 'IN'), ('how', 'WRB'), ('writer', 'NN'), ('pro', 'NN') , ('ou', 'CC'), ...

1 a resposta

Processamento de texto Python: NLTK e pandas

Estou procurando uma maneira eficaz de construir uma matriz de documentos de termos em Python que possa ser usada junto com dados extras. Eu tenho alguns dados de texto com alguns outros atributos. Gostaria de executar algumas análises no texto ...

2 a resposta

Como armazenar ner result em json / database

import nltk from itertools import groupby def get_continuous_chunks(tagged_sent): continuous_chunk = [] current_chunk = [] for token, tag in tagged_sent: if tag != "O": current_chunk.append((token, tag)) else: if current_chunk: # if the current ...

2 a resposta

O analisador de malte fornece erro de asserção ao usá-lo com o nltk

Estou usando o analisador de malte com python nltk. Fiz o download dos dados do treinamento e atualizei o nltk mais recente. Quando eu chamo o analisador de malte, ocorre um erro de aserção. Abaixo está o código do python, que também inclui o ...

1 a resposta

NLTK pos_tag do Python lança URLError

Eu estava tentando usar opos_tag função no NLTK 3 (no Windows), mas este erro apareceu: >>> import nltk >>> tokens = nltk.word_tokenize("This is a sentence!") >>> tokens ['This', 'is', 'a', 'sentence', '!'] >>> tags = ...

1 a resposta

NLTK: lematizador e pos_tag [duplicado]

Esta pergunta já tem uma resposta aqui: lematização wordnet e marcação pos em python [/questions/15586721/wordnet-lemmatization-and-pos-tagging-in-python] 6 respostasEu construo um Corpus de Texto Simples e o próximo passo é lematizar todos os ...

2 a resposta

Stanford NER no NLTK não codifica várias frases corretamente - Python

Eu tenho uma função que retorna as entidades nomeadas em um determinado corpo de texto, usando o NER de Stanford. def get_named_entities(text): load_ner_files() print text[:100] # to show that the text is fine text_split = text.split() print ...

2 a resposta

O nltk não adiciona $ NLTK_DATA ao caminho de pesquisa?

no linux, configurei env var $ NLTK_DATA ('/ home / user / data / nltk') e o teste de sopro funciona conforme o esperado >>> from nltk.corpus import brown >>> brown.words() ['The', 'Fulton', 'County', 'Grand', 'Jury', 'said', ...]mas ao executar ...