Resultados de la búsqueda a petición "nlp"

1 la respuesta

¿Cómo usar el CountVectorizerand () de sklearn para obtener ngrams que incluyen cualquier puntuación como tokens separados?

yo suelosklearn.feature_extraction.text.CountVectorizer [http://scikit-learn.org/stable/modules/generated/sklearn.feature_extraction.text.CountVectorizer.html] para calcular n-gramos. Ejemplo: import sklearn.feature_extraction.text # ...

1 la respuesta

¿Cuáles son las principales diferencias y beneficios de los algoritmos de carga de Porter y Lancaster? [cerrado]

Estoy trabajando en tareas de clasificación de documentos en java.Ambos algoritmos fueron altamente recomendados, ¿cuáles son los beneficios y desventajas de...

3 la respuesta

División de documentos chinos en oraciones [cerrado]

Tengo que dividir el texto chino en varias oraciones. Probé el Stanford DocumentPreProcessor. Funcionó bastante bien para inglés pero no para chino. Por favor, ¿pueden informarme de cualquier buen divisor de frases para chino, preferiblemente en ...

1 la respuesta

¿Alguien sabe de algún buen software de Desambiguación de Sentido de Word? [cerrado]

¿Qué representa el estado del arte en el software Word Sense Disambiguation (WSD)? ¿Qué métricas determinan el estado del arte y qué kits de herramientas / paquetes de código abierto están disponibles?

2 la respuesta

Error al crear el objeto StanfordCoreNLP

He descargado e instalado los archivos jar necesarios de http://nlp.stanford.edu/software/corenlp.shtml#Download [http://nlp.stanford.edu/software/corenlp.shtml#Download]. He incluido los cinco archivos ...

11 la respuesta

Procesamiento del lenguaje natural: ¿Encontrar obscenidades en inglés?

Dado un conjunto de palabras etiquetadas para una parte del discurso, quiero encontrar aquellas que son obscenidades en el inglés convencional. ¿Cómo podría ...

5 la respuesta

¿Cómo realizar la lematización en R?

Esta pregunta es un posible duplicado deLemmatizer en R o python (am, are, is -> be?) [https://stackoverflow.com/questions/22993796/lemmatizer-in-r-or-python-am-are-is-be] , pero lo agrego nuevamente ya que el anterior se cerró diciendo que ...

5 la respuesta

Estrategia para analizar descripciones de lenguaje natural en datos estructurados

Tengo un conjunto de requisitos y estoy buscando el mejor Basado en Java estrategia / algorthm / software a utilizar. Básicamente, quiero tomar un conjunto de ingredientes de recetas ingresados por personas reales en inglés natural y analizar ...

5 la respuesta

¿Hay un motor de búsqueda que dará una respuesta directa? [cerrado

Me he estado preguntando acerca de esto por un tiempo y no puedo ver por qué Google aún no lo ha intentado, o tal vez lo hayan hecho y simplemente no lo sé. ¿Existe un motor de búsqueda en el que pueda escribir una pregunta que le dará una ...

4 la respuesta

Agregar / eliminar palabras de detención con espacios

¿Cuál es la mejor manera de agregar / eliminar palabras vacías con espacios? estoy usandotoken.is_stop [https://spacy.io/docs/api/token]función y me gustaría hacer algunos cambios personalizados en el conjunto. Estaba mirando la documentación ...