Resultados de la búsqueda a petición "corpus"

3 la respuesta

R Corpus está estropeando mi texto codificado UTF-8

Simplemente estoy tratando de crear un corpus de texto ruso codificado en UTF-8. El problema es que el método Corpus detm El paquete no codifica las cadenas correctamente. Aquí hay un ejemplo reproducible de mi problema: Cargue en el texto ...

3 la respuesta

Crear un nuevo corpus con NLTK

Calculé que a menudo la respuesta a mi título es ir a leer las documentaciones, pero repasé elLibro NLTK [http://www.nltk.org/book]Pero no da la respuesta. Soy un poco nuevo en Python. Tengo un montón de.txt archivos y quiero poder utilizar las ...

4 la respuesta

Medios más eficientes de crear un corpus y DTM con 4M filas

Mi archivo tiene más de 4 millones de filas y necesito una forma más eficiente de convertir mis datos en un corpus y una matriz de términos de documentos para poder pasarlos a un clasificador bayesiano. Considere el siguiente ...

3 la respuesta

¿Cómo puedo imprimir todo el contenido de Wordnet (preferiblemente con NLTK)?

NLTK proporciona funciones para imprimir todas las palabras en el corpus Brown (o Gutenberg). Pero la función equivalente no parece funcionar en Wordnet. ¿Hay alguna manera de hacer esto a través de NLTK? Si no lo hay, ¿cómo podría uno ...

3 la respuesta

Buscando un conjunto de datos para probar búsquedas de estilo FULLTEXT en [cerrado]

Estoy buscando un corpus de texto para ejecutar algunas búsquedas de datos de estilo de texto completo de prueba. O algo que puedo descargar, o un sistema que lo genera. Algo un poco más aleatorio sería mejor, p. 1,000,000 artículos de wikipedia ...

4 la respuesta

Error de DocumentTermMatrix en argumento Corpus

Tengo el siguiente código: # returns string w/o leading or trailing whitespace trim <- function (x) gsub("^\\s+|\\s+$", "", x) news_corpus <- Corpus(VectorSource(news_raw$text)) # a column of strings. corpus_clean <- tm_map(news_corpus, tolower) ...

1 la respuesta

¿Cómo transformar una lista en un corpus en r?

En estopregunta [https://stackoverflow.com/questions/33920330/split-a-huge-dataframe-in-many-smaller-dataframes-to-create-a-corpus-in-r/] Pregunté cómo dividir un gran marco de datos para crear un corpus. Gracias a la respuesta pude crear una ...

4 la respuesta

¿Cómo puedo cambiar el tiempo de espera predeterminado de la conexión Mysql cuando me conecto a través de python?

Me conecté a una base de datos mysql usando python

4 la respuesta

¿Instalar programáticamente corporaciones / modelos NLTK, es decir, sin el descargador de GUI?

Mi proyecto utiliza el NLTK. ¿Cómo puedo enumerar los requisitos del modelo y el corpus del proyecto para que puedan instalarse automáticamente? No quiero hacer clic en lanltk.download() GUI, instalando paquetes uno por uno. Además, cualquier ...

3 la respuesta

Necesita un diccionario de inglés o Corpus gratis, en última instancia para una base de datos MySQL [cerrado]

Estoy tratando de encontrar un diccionario descargable gratuito (o Corpus podría ser la mejor palabra) que puedo importar a MySQL. Necesito palabras para ten...