Resultados de la búsqueda a petición "n-gram"

2 la respuesta

Vectorización de ngram de palabra realmente rápida en R

editar: El nuevo paquete text2vec es excelente y resuelve este problema (y muchos otros) realmente bien. text2vec en CRAN [https://cran.r-project.org/web/packages/text2vec/index.html] text2vec en github [https://github.com/dselivanov/text2vec] ...

4 la respuesta

Encontrar ngrams en R y comparar ngrams a través de cuerpos

Estoy empezando con el paquete tm en R, así que, por favor, tengan paciencia conmigo y pido disculpas por la gran pared de texto. He creado un corpus bastant...

0 la respuesta

Obtener los documentos más probables de la consulta usando el filtro fonético en solr

estoy usandosolrparacorrector ortográfico / corrección de consultas. Yo he añadidosolr.PhoneticFilterFactoryysolr.NGramFilterFactoryen fieldType para realizarcorrección ortográfica. Estáfuncionando bienpero aqui elproblemaes que soyobtener número ...

4 la respuesta

forma más rápida de detectar n-gramos en una cadena?

Encontré esta solución en SO para detectar n-gramos en una cadena: (aquí: Generación de N-gram a partir de una oración [https://stackoverflow.com/questions/3656762/n-gram-generation-from-a-sentence]) import java.util.*; public class Test { ...

7 la respuesta

Generación de N-gram a partir de, una oración

Cómo generar un n-gramo de una cadena como: String Input="This is my car."Quiero generar n-gram con esta entrada: Input Ngram size = 3La salida debe ser: This is my car This is is my my car This is my is my carDa una idea en Java, cómo ...

2 la respuesta

Elasticsearch - EdgeNgram + highlight + term_vector = malos destacados

Cuando uso un analizador con edgengram (min = 3, max = 7, frente) + term_vector = with_positions_offsetsCon el documento que tiene el texto = "CouchDB&q...

3 la respuesta

Implementación rápida de n-gramas de caracteres usando python

3 la respuesta

Python NLTK: Bigrams trigrams fourgrams

Tengo este ejemplo y quiero saber cómo obtener este resultado. Tengo texto y lo tokenizo, luego recojo el bigram y el trigram y fourgram así import nltk from nltk import word_tokenize from nltk.util import ngrams text = "Hi How are you? i am ...

2 la respuesta

Extracción NGram eficiente de CPU y memoria con R

Escribí un algoritmo que extrae NGrams (bigrams, trigrams, ... hasta 5 gramos) de una lista de 50000 direcciones. Mi objetivo es tener para cada dirección un vector booleano que represente si los NGrams están presentes o no en la dirección. Por ...

8 la respuesta

Cálculo de N gramos usando Python

Necesitaba calcular los Unigrams, BiGrams y Trigrams para un archivo de texto que contenga texto como:"La fibrosis quística afecta a 30,000 niños y adul...