Resultados da pesquisa a pedido "nltk"

0 a resposta

nltk: Como lematizar a incorporação das palavras ao redor?

O código a seguir é impressoleaf: from nltk.stem.wordnet import WordNetLemmatizer lem = WordNetLemmatizer() print(lem.lemmatize('leaves'))Isso pode ou não ser exato, dependendo do contexto circundante, por exemploMary leaves the room vs.Dew ...

3 a resposta

Python NLTK: Bigrams trigrams fourgrams

Eu tenho este exemplo e quero saber como obter esse resultado. Eu tenho texto e tokenizo, então coleciono o bigram e trigram e fourgram assim import nltk from nltk import word_tokenize from nltk.util import ngrams text = "Hi How are you? i am ...

3 a resposta

Reconhecimento de entidade nomeada com expressão regular: NLTK

Eu tenho jogado com o kit de ferramentas NLTK. Me deparei muito com esse problema e procurei a solução on-line, mas em nenhum lugar obtive uma resposta satisfatória. Então, eu estou colocando minha consulta aqui. Muitas vezes, o NER não ...

4 a resposta

Como extrair substantivos usando NLTK pos_tag ()?

Eu sou bastante novo para python. Eu não sou capaz de descobrir o bug. Eu quero extrair substantivos usando NLTK. Eu escrevi o seguinte código: import nltk sentence = "At eight o'clock on Thursday film morning word line test best beautiful Ram ...

4 a resposta

Como extrair frases comuns / significativas de uma série de entradas de texto

Eu tenho uma série de itens de texto - HTML bruto de um banco de dados MySQL. Desejo encontrar as frases mais comuns nessas entradas (não a frase mais comum e, idealmente, não aplicando a correspondência palavra por palavra). Meu exemplo é ...

3 a resposta

Como imprimo apenas a própria palavra em um sincronismo do WordNet usando o Python NLTK?

Existe uma maneira no Python 2.7 usandoNLTK para obter apenas a palavra e não a formatação extra que inclui"synset" e os parênteses e o"n.01" etc? Por exemplo, se eu fizer wn.synsets('dog')Meus resultados se parecem com: [Synset('dog.n.01'), ...

6 a resposta

Qual é o melhor método de stemming no Python?

Eu tentei todos os métodos nltk para stemming, mas isso me deu resultados estranhos com algumas palavras. Exemplos Costuma cortar o final das palavras quando não deve fazê-lo: poodle => poodlartigo artigoou não é muito bom: fácil e fácil não ...

4 a resposta

NLTK WordNet Lemmatizer: Não deveria lematizar todas as flexões de uma palavra?

Estou usando o NLTK WordNet Lemmatizer para um projeto de marcação com parte do discurso, modificando primeiro cada palavra do corpus de treinamento em seu radical (modificação no local) e depois treinando apenas no novo corpus. No entanto, ...

4 a resposta

Python (nltk) - UnicodeDecodeError: o codec 'ascii' não pode decodificar byte

Eu sou novo no NLTK. Estou recebendo esse erro e procurei por codificação / decodificação e especificamente pelo UnicodeDecodeError, mas esse erro parece específico ao código-fonte do NLTK. Aqui está o erro: Traceback (most recent call last): ...

5 a resposta

NLTK 3 POS_TAG lança UnicodeDecodeError

Oi, eu estou tentando aprender NLTK. Eu sou novo no Python também. Estou tentando o seguinte. >>import nltk >>nltk.pos_tag(nltk.word_tokenize("John lived in China"))Eu recebi a seguinte mensagem de erro Traceback (última chamada mais recente): ...