Resultados de la búsqueda a petición "nltk"

3 la respuesta

Cálculo rápido de n-gramas

Estoy usando NLTK para buscar n-gramas en un corpus, pero en algunos casos lleva mucho tiempo. He notado que calcular n-gramas no es una característica poco común en otros paquetes (aparentemente Haystack tiene alguna funcionalidad). ¿Significa ...

3 la respuesta

extraer relaciones usando NLTK

Esto es un seguimiento de mi pregunta [https://stackoverflow.com/questions/7757554/extract-business-titles-and-time-periods-from-string] . Estoy usando nltk para analizar personas, organizaciones y sus relaciones. Utilizandoeste ...

3 la respuesta

¿Cómo abordo esta tarea de clasificación de entidad con nombre?

Estoy haciendo una pregunta relacionadaaqu [https://stackoverflow.com/questions/8219772/how-do-i-form-a-feature-vector-for-a-classifier-targeted-at-named-entity-recogni] pero esta pregunta es más general. Tomé grandes corpus y anoté algunas ...

2 la respuesta

Instantiando y usando StanfordTagger dentro de NLTK

Me disculpo por la naturaleza novata de esta pregunta: he estado tratando de descubrir el empaquetado y los espacios de nombres de Python, pero los puntos más finos parecen eludirme. A saber, me gustaría usar el envoltorio de Python para ...

10 la respuesta

¿Qué me pide que descargue el etiquetador NLTK POS?

Acabo de comenzar a usar un etiquetador de parte del discurso, y estoy enfrentando muchos problemas. Inicié el etiquetado de POS con lo siguiente: import nltk text=nltk.word_tokenize("We are going out.Just you and me.")Cuando quiero ...

2 la respuesta

Utilizando mi propio corpus para la clasificación de categoría en Python NLTK

Soy un principiante de NTLK / Python y logré cargar mi propio corpus usando CategorizedPlaintextCorpusReader, pero ¿cómo realmente entreno y uso los datos para la clasificación de texto? >>> from nltk.corpus.reader import ...

6 la respuesta

Tokenizing unicode usando nltk

Tengo archivos de texto que usan codificación utf-8 que contienen caracteres como 'ö', 'ü', etc. Me gustaría analizar el texto de estos archivos, pero no puedo hacer que el tokenizer funcione correctamente. Si uso el tokenizer nltk estándar: f ...

10 la respuesta

NLTK piensa que los imperativos son sustantivos

Estoy usando el pos_tagger en las recetas. Un problema que tengo es que el pos_tagger devuelve que las palabras en tiempo imperativo son sustantivos, ¿no deberían ser verbos? Por ejemplo Con la entrada: combine 1 1/2 cups floud, 3/4 cup sugar, ...

34 la respuesta

Reemplazo de números ordinarios

Actualmente estoy buscando la forma de reemplazar palabras como primero, segundo, tercero, ... con la representación apropiada del número ordinal (1 °, 2 °, 3 °). Estuve buscando en Google durante la última semana y no encontré ninguna ...