Resultados de la búsqueda a petición "nltk"
Alguien sabe cómo configurar la clase de envoltura de hunpos en nltk?
Intenté el siguiente código y lo instalé desdehttp: //code.google.com/p/hunpos/downloads/lis [http://code.google.com/p/hunpos/downloads/list] english-wsj-1.0 hunpos-1.0-linux.tgz extraje el archivo en el directorio '~ /' y cuando probé ...
NLTK WordNetLemmatizer: no lematizar como se esperaba
Estoy tratando de lematizar todas las palabras en una oración con WordNetLemmatizer de NLTK. Tengo un montón de oraciones, pero solo estoy usando la primera oración para asegurarme de que estoy haciendo esto correctamente. Esto es lo que ...
¿El mecanismo de lematización reduce el tamaño del cuerpo?
Queridos miembros de la comunidad, Durante el preprocesamiento de datos, después de dividir los raw_data en tokens, he usado el popular WordNet Lemmatizer para generar los tallos. Estoy realizando experimentos en un conjunto de datos que tiene ...
RegEx Tokenizer para dividir un texto en palabras, dígitos y signos de puntuación
o que quiero hacer es dividir un texto en sus elementos principales. Por ejemplo from nltk.tokenize import * txt = "A sample sentences with digits like 2.119,99 or 2,99 are awesome." regexp_tokenize(txt, ...
Ejemplos prácticos de uso de NLTK [cerrado]
Estoy jugando con laKit de herramientas de lenguaje natural [http://www.nltk.org/] (NLTK). Su documentación Libr [http://www.nltk.org/book] yCÓM [http://nltk.googlecode.com/svn/trunk/doc/howto/index.html]) son bastante voluminosos y los ...
Lemmatizar palabras etiquetadas en POS con NLTK?
Tengo POS etiquetado algunas palabras con nltk.pos_tag (), por lo que se les da etiquetas de árbol de árbol. Me gustaría lematizar estas palabras usando las etiquetas POS conocidas, pero no estoy seguro de cómo hacerlo. Estaba mirando ...
Cómo eliminar palabras de detención usando nltk o python
Así que tengo un conjunto de datos que me gustaría eliminar las palabras de detención del uso de stopwords.words('english') Estoy luchando por cómo usar esto dentro de mi código para simplemente sacar estas palabras. Ya tengo una lista de las ...
Por qué la perplejidad del vocabulario acolchado es infinitivo para nltk.lm bigram?
Estoy probando elperplexity medida para un modelo de idioma para un texto: train_sentences = nltk.sent_tokenize(train_text) test_sentences = nltk.sent_tokenize(test_text) train_tokenized_text = ...
Para encontrar sinónimos, definiciones y oraciones de ejemplo usando WordNet
Necesito tomar un archivo de texto de entrada con una sola palabra. Luego necesito encontrar los lemma_names, la definición y los ejemplos del synset de la palabra usando wordnet. He leído el libro: "Procesamiento de texto de Python con NLTK 2.0 ...
Deshágase de las palabras vacías y la puntuación
Estoy luchando con la palabra clave NLTK. Aquí está mi código ... ¿Alguien podría decirme qué pasa? from nltk.corpus import stopwords def removeStopwords( palabras ): return [ word for word in palabras if word not in ...