Resultados de la búsqueda a petición "string-matching"

2 la respuesta

Detección de sufijo de cadena eficiente

Estoy trabajando con PySpark en un gran conjunto de datos, donde quiero filtrar el marco de datos basado en cadenas en otro marco de datos. Por ejemplo dd ...

1 la respuesta

Unir dos conjuntos de datos usando lógica difusa en R

Estoy tratando de hacer una unión lógica difusa en R entre dos conjuntos de datos: El primer conjunto de datos tiene el nombre de una ubicación y una columna llamadaconfigEl segundo conjunto de datos tiene el nombre de una ubicación y ...

1 la respuesta

Coincidencia eficiente de cadenas en Apache Spark

Usando una herramienta de OCR, extraje textos de capturas de pantalla (aproximadamente 1-5 oraciones cada uno). Sin embargo, al verificar manualmente el texto extraído, noté varios errores que ocurren de vez en cuando. Dado el texto "¡Hola! ¡Me ...

2 la respuesta

R fuzzy string match para devolver una columna específica basada en una cadena coincidente

Tengo dos grandes conjuntos de datos, uno alrededor de medio millón de registros y el otro alrededor de 70K. Estos conjuntos de datos tienen dirección. Quiero coincidir si alguna de las direcciones en el conjunto de datos más pequeño ...

1 la respuesta

R Coincidencia de cadena para la dirección usando stringdist, stringdistmatrix

Tengo dos grandes conjuntos de datos, uno alrededor de medio millón de registros y el otro alrededor de 70K. Estos conjuntos de datos tienen dirección. Quiero coincidir si alguna de las direcciones en el conjunto de datos más pequeño ...

3 la respuesta

encontrar líneas de un archivo en otro

Entonces tengo un archivo1.txt con una lista de nombres, y un archivo2.txt con otra lista de nombres y necesito una lista con los nombres que están en ambos archivos. Lo intentégrep-f file1.txt file2.txt > newlist.txt pero por alguna razón ...

2 la respuesta

Encuentra cadenas coincidentes entre dos vectores en R

Tengo dos vectores en R. Quiero encontrar coincidencias parciales entre ellos. Mis datosEl primero es de un conjunto de datos llamado muc, que contiene 6400 nombres de calles. muc $ name se parece a: muc$name = c("Berberichweg", ...

5 la respuesta

Una de las cadenas en la matriz para que coincida con una expresión

El problema: Tengo una serie de promesas que se resuelven en unconjunto de cuerdas. Ahora la prueba debe pasar si al menos una de las cadenas coincide con una expresión regular. Actualmente, lo resuelvo usando una concatenación de cadenas ...

4 la respuesta

Eliminar los extremos de las entradas de cadena en la columna Pandas DataFrame

Tengo un marco de datos de pandas con una columna de una lista de archivos import pandas as pd df = pd.read_csv('fname.csv') df.head() filename A B C fn1.txt 2 4 5 fn2.txt 1 2 1 fn3.txt .... ....Me gustaría eliminar la extensión del archivo.txt ...

2 la respuesta

compruebe si todos los caracteres de una cadena existen en otra cadena en r

Estoy tratando de comparar cadenas comoPRABHAKAR SHARMA ySHARMA KUMAR PRABHAKAR. la intención es verificar si todos los caracteres de la cadena más corta existen en la otra cadena. Si ese es el caso, debería obtener una coincidencia del 100%; de ...