Resultados da pesquisa a pedido "nltk"
nltk: Como lematizar a incorporação das palavras ao redor?
O código a seguir é impressoleaf: from nltk.stem.wordnet import WordNetLemmatizer lem = WordNetLemmatizer() print(lem.lemmatize('leaves'))Isso pode ou não ser exato, dependendo do contexto circundante, por exemploMary leaves the room vs.Dew ...
Python NLTK: Bigrams trigrams fourgrams
Eu tenho este exemplo e quero saber como obter esse resultado. Eu tenho texto e tokenizo, então coleciono o bigram e trigram e fourgram assim import nltk from nltk import word_tokenize from nltk.util import ngrams text = "Hi How are you? i am ...
Reconhecimento de entidade nomeada com expressão regular: NLTK
Eu tenho jogado com o kit de ferramentas NLTK. Me deparei muito com esse problema e procurei a solução on-line, mas em nenhum lugar obtive uma resposta satisfatória. Então, eu estou colocando minha consulta aqui. Muitas vezes, o NER não ...
Como extrair substantivos usando NLTK pos_tag ()?
Eu sou bastante novo para python. Eu não sou capaz de descobrir o bug. Eu quero extrair substantivos usando NLTK. Eu escrevi o seguinte código: import nltk sentence = "At eight o'clock on Thursday film morning word line test best beautiful Ram ...
Como extrair frases comuns / significativas de uma série de entradas de texto
Eu tenho uma série de itens de texto - HTML bruto de um banco de dados MySQL. Desejo encontrar as frases mais comuns nessas entradas (não a frase mais comum e, idealmente, não aplicando a correspondência palavra por palavra). Meu exemplo é ...
Como imprimo apenas a própria palavra em um sincronismo do WordNet usando o Python NLTK?
Existe uma maneira no Python 2.7 usandoNLTK para obter apenas a palavra e não a formatação extra que inclui"synset" e os parênteses e o"n.01" etc? Por exemplo, se eu fizer wn.synsets('dog')Meus resultados se parecem com: [Synset('dog.n.01'), ...
Qual é o melhor método de stemming no Python?
Eu tentei todos os métodos nltk para stemming, mas isso me deu resultados estranhos com algumas palavras. Exemplos Costuma cortar o final das palavras quando não deve fazê-lo: poodle => poodlartigo artigoou não é muito bom: fácil e fácil não ...
NLTK WordNet Lemmatizer: Não deveria lematizar todas as flexões de uma palavra?
Estou usando o NLTK WordNet Lemmatizer para um projeto de marcação com parte do discurso, modificando primeiro cada palavra do corpus de treinamento em seu radical (modificação no local) e depois treinando apenas no novo corpus. No entanto, ...
Python (nltk) - UnicodeDecodeError: o codec 'ascii' não pode decodificar byte
Eu sou novo no NLTK. Estou recebendo esse erro e procurei por codificação / decodificação e especificamente pelo UnicodeDecodeError, mas esse erro parece específico ao código-fonte do NLTK. Aqui está o erro: Traceback (most recent call last): ...
NLTK 3 POS_TAG lança UnicodeDecodeError
Oi, eu estou tentando aprender NLTK. Eu sou novo no Python também. Estou tentando o seguinte. >>import nltk >>nltk.pos_tag(nltk.word_tokenize("John lived in China"))Eu recebi a seguinte mensagem de erro Traceback (última chamada mais recente): ...