Resultados de la búsqueda a petición "levenshtein-distance"

1 la respuesta

Algoritmo de tipo Levenshtein con vectores numéricos

Tengo dos vectores con valores numéricos. Como v1 <- c(1, 3, 4, 5, 6, 7, 8) v2 <- c(54, 23, 12, 53, 7, 8)Me gustaría calcular el número deinserciones, eliminacionesyreemplazosque necesito convertir un vector en otro con ciertos costos por ...

1 la respuesta

mySQL - entrada de formulario latino (inglés) coincidente con datos utf8 (que no están en inglés)

Mantengo una base de datos de música en mySQL, ¿cómo devuelvo los resultados almacenados en p. Ej. 'Tiësto' cuando la gente busca 'Tiesto'? Todos los datos se almacenan en indexación de texto completo, si eso hace alguna diferencia. Ya estoy ...

2 la respuesta

R: String Fuzzy Matching usando jarowinkler

Tengo dos vectores de caracteres tipo en R. Quiero poder comparar la lista de referencia con la lista de caracteres sin formato utilizando jarowinkler y asignar un puntaje de% de similitud. Entonces, por ejemplo, si tengo 10 elementos de ...

1 la respuesta

Optimización del algoritmo de distancia de Levenshtein

Tengo un procedimiento almacenado que usa la distancia de Levenshtein para determinar el resultado más cercano a lo que escribió el usuario. Lo único que realmente afecta la velocidad es la función que calcula la distancia de Levenshtein para ...

3 la respuesta

¿Distancia rápida de Levenshtein en R?

¿Existe un paquete que contenga la función de conteo de distancias de Levenshtein que se implementa como un código C o Fortran? Tengo muchas cadenas para comparar ystringMatch deMiscPsycho es demasiado lento para esto

6 la respuesta

La forma más eficiente de calcular la distancia de Levenshtein

Acabo de implementar un algoritmo de búsqueda de archivos de mejor coincidencia para encontrar la coincidencia más cercana a una cadena en un diccionario. Después de perfilar mi código, descubrí que la gran mayoría del tiempo se gasta calculando ...

1 la respuesta

Encontrar el vecino más cercano utilizando el algoritmo de Levenshtein optimizado

Yo recientementepublicado una pregunta [https://stackoverflow.com/questions/3183149/most-efficient-way-to-calculate-levenshtein-distance] sobre la optimización del algoritmo para calcular la distancia de Levenshtein, y las respuestas me llevan al ...

4 la respuesta

Algoritmo de búsqueda difusa (algoritmo aproximado de coincidencia de cadenas)

Deseo crear un algoritmo de búsqueda difusa. Sin embargo, tras horas de investigación, realmente estoy luchando. Quiero crear un algoritmo que realice una búsqueda difusa en una lista de nombres de escuelas. Esto es lo que he visto hasta ...

2 la respuesta

¿Cómo puedo crear un umbral para cadenas similares usando la distancia de Levenshtein y tener en cuenta los errores tipográficos?

Recientemente encontramos un problema interesante en el trabajo donde descubrimos datos duplicados enviados por el usuario en nuestra base de datos. Nos dimos cuenta de que la distancia de Levenshtein entre la mayoría de estos datos era ...

3 la respuesta

¿Cómo funcionan los diff / patch y qué tan seguros son?

En cuanto a cómo funcionan, me preguntaba cosas de trabajo de bajo nivel: ¿Qué desencadenará un conflicto de fusión?¿Las herramientas también usan el contexto para aplicar el parche?¿Cómo manejan los cambios que en realidad no modifican el ...