Resultados de la búsqueda a petición "nltk"
nltk para python 3.6 en windows64
Soy nuevo enpython, Estoy usando Windows 10 y tengo python36 y básicamente tengo que usarnltk para mi proyecto y básicamente tengo dos preguntas. 1 escuchépip se descarga automáticamente para las versiones 3+ pero cuando escribopip install nltk ...
SnowballStemmer para la lista de palabras rusas
Sí sé cómo realizar SnowballStemmer en una sola palabra (en mi caso, en ruso). Haciendo lo siguiente: from nltk.stem.snowball import SnowballStemmer stemmer = SnowballStemmer("russian") stemmer.stem("Василий") 'Васил'¿Cómo puedo hacer ...
¿Cómo aplicar la biblioteca NLTK word_tokenize en un marco de datos Pandas para datos de Twitter?
Este es el código que estoy usando para el análisis semántico de Twitter: - import pandas as pd import datetime import numpy as np import re from nltk.tokenize import word_tokenize from nltk.corpus import stopwords from nltk.stem.wordnet import ...
ne_chunk sin pos_tag en NLTK
Estoy tratando de fragmentar una oración usando ne_chunk y pos_tag en nltk. from nltk import tag from nltk.tag import pos_tag from nltk.tree import Tree from nltk.chunk import ne_chunk sentence = "Michael and John is reading a booklet in a ...
¿Cómo POS_TAG una oración en francés?
Estoy buscando una manera depos_tag Se usa una oración en francés como el siguiente código para las oraciones en inglés: def pos_tagging(sentence): var = sentence exampleArray = [var] for item in exampleArray: tokenized = ...
Cómo deshacerse de la advertencia "DeprecationWarning generador 'ngrams' levantó StopIteration"
Mientras trabajaba en un cuaderno Kaggle me encontré con un problema. El siguiente bloque de código: from nltk import ngrams def grams(tokens): return list(ngrams(tokens, 3)) negative_grams = preprocessed_negative_tweets.apply(grams)resultó en ...
Contando la frecuencia de palabras en un marco de datos de pandas
Tengo una tabla como la siguiente: URN Firm_Name 0 104472 R.X. Yah & Co 1 104873 Big Building Society 2 109986 St James's Society 3 114058 The Kensington Society Ltd 4 113438 MMV Oil Associates LtdY quiero contar la frecuencia de todas las ...
Cambie el directorio de ruta nltk.download () del valor predeterminado ~ / ntlk_data
Estaba intentando descargar / actualizar Pythonnltk paquetes en un servidor informático y devolvió esto[Errno 122] Disk quota exceeded: error. Específicamente: [nltk_data] Downloading package stop words to /home/sh2264/nltk_data... [nltk_data] ...
Fragmento de código NLTK de Python para entrenar a un clasificador (bayes ingenuos) usando la frecuencia de función
Me preguntaba si alguien podría ayudarme a través de un fragmento de código que demuestre cómo entrenar al clasificador Naive Bayes utilizando un método de frecuencia de funciones en lugar de la presencia de funciones. Presumo lo siguiente como ...
¿Lematización de palabras que no están en inglés?
Me gustaría aplicar la lematización para reducir las formas flexivas de las palabras. Sé que para el idioma inglés, WordNet proporciona dicha funcionalidad, pero también estoy interesado en aplicar la lematización para palabras holandesas, ...