Resultados de la búsqueda a petición "n-gram"
Vectorización de ngram de palabra realmente rápida en R
editar: El nuevo paquete text2vec es excelente y resuelve este problema (y muchos otros) realmente bien. text2vec en CRAN [https://cran.r-project.org/web/packages/text2vec/index.html] text2vec en github [https://github.com/dselivanov/text2vec] ...
Encontrar ngrams en R y comparar ngrams a través de cuerpos
Estoy empezando con el paquete tm en R, así que, por favor, tengan paciencia conmigo y pido disculpas por la gran pared de texto. He creado un corpus bastant...
Obtener los documentos más probables de la consulta usando el filtro fonético en solr
estoy usandosolrparacorrector ortográfico / corrección de consultas. Yo he añadidosolr.PhoneticFilterFactoryysolr.NGramFilterFactoryen fieldType para realizarcorrección ortográfica. Estáfuncionando bienpero aqui elproblemaes que soyobtener número ...
forma más rápida de detectar n-gramos en una cadena?
Encontré esta solución en SO para detectar n-gramos en una cadena: (aquí: Generación de N-gram a partir de una oración [https://stackoverflow.com/questions/3656762/n-gram-generation-from-a-sentence]) import java.util.*; public class Test { ...
Generación de N-gram a partir de, una oración
Cómo generar un n-gramo de una cadena como: String Input="This is my car."Quiero generar n-gram con esta entrada: Input Ngram size = 3La salida debe ser: This is my car This is is my my car This is my is my carDa una idea en Java, cómo ...
Elasticsearch - EdgeNgram + highlight + term_vector = malos destacados
Cuando uso un analizador con edgengram (min = 3, max = 7, frente) + term_vector = with_positions_offsetsCon el documento que tiene el texto = "CouchDB&q...
Python NLTK: Bigrams trigrams fourgrams
Tengo este ejemplo y quiero saber cómo obtener este resultado. Tengo texto y lo tokenizo, luego recojo el bigram y el trigram y fourgram así import nltk from nltk import word_tokenize from nltk.util import ngrams text = "Hi How are you? i am ...
Extracción NGram eficiente de CPU y memoria con R
Escribí un algoritmo que extrae NGrams (bigrams, trigrams, ... hasta 5 gramos) de una lista de 50000 direcciones. Mi objetivo es tener para cada dirección un vector booleano que represente si los NGrams están presentes o no en la dirección. Por ...
Cálculo de N gramos usando Python
Necesitaba calcular los Unigrams, BiGrams y Trigrams para un archivo de texto que contenga texto como:"La fibrosis quística afecta a 30,000 niños y adul...
Página 1 de 2