Resultados de la búsqueda a petición "nltk"

1 la respuesta

Alguien sabe cómo configurar la clase de envoltura de hunpos en nltk?

Intenté el siguiente código y lo instalé desdehttp: //code.google.com/p/hunpos/downloads/lis [http://code.google.com/p/hunpos/downloads/list] english-wsj-1.0 hunpos-1.0-linux.tgz extraje el archivo en el directorio '~ /' y cuando probé ...

2 la respuesta

NLTK WordNetLemmatizer: no lematizar como se esperaba

Estoy tratando de lematizar todas las palabras en una oración con WordNetLemmatizer de NLTK. Tengo un montón de oraciones, pero solo estoy usando la primera oración para asegurarme de que estoy haciendo esto correctamente. Esto es lo que ...

1 la respuesta

¿El mecanismo de lematización reduce el tamaño del cuerpo?

Queridos miembros de la comunidad, Durante el preprocesamiento de datos, después de dividir los raw_data en tokens, he usado el popular WordNet Lemmatizer para generar los tallos. Estoy realizando experimentos en un conjunto de datos que tiene ...

1 la respuesta

RegEx Tokenizer para dividir un texto en palabras, dígitos y signos de puntuación

o que quiero hacer es dividir un texto en sus elementos principales. Por ejemplo from nltk.tokenize import * txt = "A sample sentences with digits like 2.119,99 or 2,99 are awesome." regexp_tokenize(txt, ...

3 la respuesta

Ejemplos prácticos de uso de NLTK [cerrado]

Estoy jugando con laKit de herramientas de lenguaje natural [http://www.nltk.org/] (NLTK). Su documentación Libr [http://www.nltk.org/book] yCÓM [http://nltk.googlecode.com/svn/trunk/doc/howto/index.html]) son bastante voluminosos y los ...

2 la respuesta

Lemmatizar palabras etiquetadas en POS con NLTK?

Tengo POS etiquetado algunas palabras con nltk.pos_tag (), por lo que se les da etiquetas de árbol de árbol. Me gustaría lematizar estas palabras usando las etiquetas POS conocidas, pero no estoy seguro de cómo hacerlo. Estaba mirando ...

8 la respuesta

Cómo eliminar palabras de detención usando nltk o python

Así que tengo un conjunto de datos que me gustaría eliminar las palabras de detención del uso de stopwords.words('english') Estoy luchando por cómo usar esto dentro de mi código para simplemente sacar estas palabras. Ya tengo una lista de las ...

1 la respuesta

Por qué la perplejidad del vocabulario acolchado es infinitivo para nltk.lm bigram?

Estoy probando elperplexity medida para un modelo de idioma para un texto: train_sentences = nltk.sent_tokenize(train_text) test_sentences = nltk.sent_tokenize(test_text) train_tokenized_text = ...

4 la respuesta

Para encontrar sinónimos, definiciones y oraciones de ejemplo usando WordNet

Necesito tomar un archivo de texto de entrada con una sola palabra. Luego necesito encontrar los lemma_names, la definición y los ejemplos del synset de la palabra usando wordnet. He leído el libro: "Procesamiento de texto de Python con NLTK 2.0 ...

2 la respuesta

Deshágase de las palabras vacías y la puntuación

Estoy luchando con la palabra clave NLTK. Aquí está mi código ... ¿Alguien podría decirme qué pasa? from nltk.corpus import stopwords def removeStopwords( palabras ): return [ word for word in palabras if word not in ...