Resultados da pesquisa a pedido "nltk"
Contando a frequência de palavras em um quadro de dados do pandas
Eu tenho uma tabela como abaixo: URN Firm_Name 0 104472 R.X. Yah & Co 1 104873 Big Building Society 2 109986 St James's Society 3 114058 The Kensington Society Ltd 4 113438 MMV Oil Associates LtdE eu quero contar a frequência de todas as ...
Obtendo o erro 405 ao tentar baixar dados nltk
Quando tento o código abaixo python -c "import nltk; nltk.download('punkt'); nltk.download('averaged_perceptron_tagger'); nltk.download('maxent_treebank_pos_tagger'); nltk.download('wordnet')"o console diz [nltk_data] Error loading punkt: HTTP ...
Como posso extrair o GPE (local) usando o NLTK ne_chunk?
Estou tentando implementar um código para verificar a condição climática de uma área específica usando a API do OpenWeatherMap e o NLTK para encontrar o reconhecimento do nome da entidade. Mas não consigo encontrar o método de passar a entidade ...
Analisador de gramática livre de contexto eficiente, de preferência compatível com Python
Preciso analisar um pequeno subconjunto de inglês de um dos meus projetos, descrito como uma gramática livre de contexto com estruturas de recursos (1 nível) ...
Lista de palavras em russo para SnowballStemmer
Eu sei como executar o SnowballStemmer em uma única palavra (no meu caso, no russo). Fazendo as próximas coisas: from nltk.stem.snowball import SnowballStemmer stemmer = SnowballStemmer("russian") stemmer.stem("Василий") 'Васил'Como posso fazer ...
Por que o classificador NLTK NaiveBayes classificou incorretamente um registro?
Esta é a primeira vez que estou construindo um modelo de aprendizado de máquina de análise de sentimentos usando o nltk NaiveBayesClassifier em Python. Eu sei que é um modelo muito simples, mas é apenas um primeiro passo para mim e tentarei ...
Como se livrar do aviso “'ngrams' do gerador de DeprecationWarning levantou StopIteration”
Enquanto trabalhava em um notebook Kaggle, deparei-me com um problema. O seguinte bloco de código: from nltk import ngrams def grams(tokens): return list(ngrams(tokens, 3)) negative_grams = preprocessed_negative_tweets.apply(grams)resultou em ...
Altere o diretório do caminho nltk.download () do padrão ~ / ntlk_data
Eu estava tentando baixar / atualizar pythonnltk pacotes em um servidor de computação e ele retornou[Errno 122] Disk quota exceeded: erro. Especificamente: [nltk_data] Downloading package stop words to /home/sh2264/nltk_data... [nltk_data] ...
Como aplicar a biblioteca NLTK word_tokenize em um dataframe do Pandas para dados do Twitter?
Este é o código que estou usando para análise semântica do twitter: - import pandas as pd import datetime import numpy as np import re from nltk.tokenize import word_tokenize from nltk.corpus import stopwords from nltk.stem.wordnet import ...
Stanford NLP Tagger via NLTK - tag_sents divide tudo em caracteres
Espero que alguém tenha experiência com isso, pois não consigo encontrar nenhum comentário on-line além de um relatório de bug de 2015 sobre o NERtagger, que provavelmente é o mesmo. De qualquer forma, estou tentando processar em lote o texto ...