Resultados de la búsqueda a petición "fuzzy-search"

4 la respuesta

Levenshtein métodos basados en distancia Vs Soundex

Segúnesta [https://stackoverflow.com/questions/41970/lightweight-fuzzy-search-library#41975] comentario en un hilo relacionado, me gustaría saber por qué los métodos basados en la distancia de Levenshtein son mejores que Soundex.

1 la respuesta

Coincidencia eficiente de cadenas en Apache Spark

Usando una herramienta de OCR, extraje textos de capturas de pantalla (aproximadamente 1-5 oraciones cada uno). Sin embargo, al verificar manualmente el texto extraído, noté varios errores que ocurren de vez en cuando. Dado el texto "¡Hola! ¡Me ...

4 la respuesta

Fusionando dos marcos de datos usando Fuzzy / Aproximate String Matching in R

DESCRIPCIÓN Tengo dos conjuntos de datos con información que necesito fusionar. Los únicos campos comunes que tengo son cadenas que no coinciden perfectamente y un campo numérico que puede ser sustancialmente diferente La única forma de ...

5 la respuesta

Búsqueda difusa de Javascript que tiene sentido

Estoy buscando una biblioteca JavaScript de búsqueda difusa para filtrar una matriz. He intentado usarfuzzyset.js [http://glench.github.io/fuzzyset.js/]y fuse.js [http://kiro.me/projects/fuse.html], pero los resultados son terribles (hay demos ...

3 la respuesta

Python Fuzzy Matching (FuzzyWuzzy) - Mantenga solo la mejor coincidencia

Estoy tratando de hacer coincidir difusamente dos archivos csv, cada uno con una columna de nombres, que son similares pero no iguales. Mi código hasta ahora es el siguiente: import pandas as pd from pandas import DataFrame from fuzzywuzzy ...

4 la respuesta

Algoritmo de búsqueda difusa (algoritmo aproximado de coincidencia de cadenas)

Deseo crear un algoritmo de búsqueda difusa. Sin embargo, tras horas de investigación, realmente estoy luchando. Quiero crear un algoritmo que realice una búsqueda difusa en una lista de nombres de escuelas. Esto es lo que he visto hasta ...

8 la respuesta

Biblioteca de búsqueda de cadenas fuzzy en Java [cerrado]

Estoy buscando una biblioteca Java de alto rendimiento para la búsqueda de cadenas difusas. Existen numerosos algoritmos para encontrar cadenas similares, distancia de Levenshtein, Daitch-Mokotoff Soundex, n-gramos, etc. ¿Qué implementaciones ...

1 la respuesta

¿Cómo puedo crear un índice con pymongo [duplicado]

Esta pregunta ya tiene una respuesta aquí: Forma / lugar recomendado para crear índice en la colección MongoDB para una aplicación web [/questions/7783331/recommended-way-place-to-create-index-on-mongodb-collection-for-a-web-applicatio] 3 ...

1 la respuesta

¿Cómo obtener los términos coincidentes de Lucene Fuzzy Search?

¿cómo se obtiene el término difuso correspondiente y su desplazamiento cuando se utiliza Lucene Fuzzy Search? IndexSearcher mem = ....(some standard code) QueryParser parser = new QueryParser(Version.LUCENE_30, CONTENT_FIELD, analyzer); TopDocs ...

22 la respuesta

Un mejor algoritmo de clasificación de similitud para cadenas de longitud variable

Estoy buscando un algoritmo de similitud de cadenas que produzca mejores resultados en cadenas de longitud variable que las que generalmente se sugieren (distancia levenshtein, índice sonoro, etc.). Por ejemplo Cadena dada A: "Robert", Luego ...