Resultados de la búsqueda a petición "nltk"

1 la respuesta

Por qué la perplejidad del vocabulario acolchado es infinitivo para nltk.lm bigram?

Estoy probando elperplexity medida para un modelo de idioma para un texto: train_sentences = nltk.sent_tokenize(train_text) test_sentences = nltk.sent_tokenize(test_text) train_tokenized_text = ...

1 la respuesta

¿El mecanismo de lematización reduce el tamaño del cuerpo?

Queridos miembros de la comunidad, Durante el preprocesamiento de datos, después de dividir los raw_data en tokens, he usado el popular WordNet Lemmatizer para generar los tallos. Estoy realizando experimentos en un conjunto de datos que tiene ...

2 la respuesta

NLTK WordNetLemmatizer: no lematizar como se esperaba

Estoy tratando de lematizar todas las palabras en una oración con WordNetLemmatizer de NLTK. Tengo un montón de oraciones, pero solo estoy usando la primera oración para asegurarme de que estoy haciendo esto correctamente. Esto es lo que ...

1 la respuesta

Identificación de la estructura de la oración - espacioso

Tengo la intención de identificar la estructura de la oración en inglés usando spacy y textacy. Por ejemplo: El gato se sentó en el tapete - SVO, El gato saltó y recogió la galleta - SVV0. El gato se comió la galleta y las galletas. - SVOO. Se ...

0 la respuesta

nltk: ¿Cómo lematizar teniendo en contexto las palabras circundantes?

Se imprime el siguiente códigoleaf: from nltk.stem.wordnet import WordNetLemmatizer lem = WordNetLemmatizer() print(lem.lemmatize('leaves'))Esto puede o no ser exacto dependiendo del contexto que lo rodea, p.Mary leaves the room vs.Dew drops ...

2 la respuesta

¿Cómo puedo extraer GPE (ubicación) usando NLTK ne_chunk?

Estoy tratando de implementar un código para verificar las condiciones climáticas de un área en particular usando la API OpenWeatherMap y NLTK para encontrar el reconocimiento del nombre de la entidad. Pero no puedo encontrar el método de pasar ...

4 la respuesta

¿Por qué el clasificador NLTK NaiveBayes clasificó erróneamente un registro?

Esta es la primera vez que estoy construyendo un modelo de aprendizaje automático de análisis de sentimientos utilizando el nltk NaiveBayesClassifier en Python. Sé que es un modelo demasiado simple, pero es solo un primer paso para mí e intentaré ...

1 la respuesta

¿Por qué mi función NLTK es lenta al procesar el DataFrame?

Estoy tratando de ejecutar una función con mis millones de líneas en un conjunto de datos. Leo los datos de CSV en un marco de datosUso la lista desplegable para descartar datos que no necesitoLo paso a través de una función NLTK en un bucle ...

2 la respuesta

Contando la frecuencia de palabras en un marco de datos de pandas

Tengo una tabla como la siguiente: URN Firm_Name 0 104472 R.X. Yah & Co 1 104873 Big Building Society 2 109986 St James's Society 3 114058 The Kensington Society Ltd 4 113438 MMV Oil Associates LtdY quiero contar la frecuencia de todas las ...

1 la respuesta

SnowballStemmer para la lista de palabras rusas

Sí sé cómo realizar SnowballStemmer en una sola palabra (en mi caso, en ruso). Haciendo lo siguiente: from nltk.stem.snowball import SnowballStemmer stemmer = SnowballStemmer("russian") stemmer.stem("Василий") 'Васил'¿Cómo puedo hacer ...