Encuentra cadenas coincidentes entre dos vectores en R
Tengo dos vectores en R. Quiero encontrar coincidencias parciales entre ellos.
Mis datosEl primero es de un conjunto de datos llamado muc, que contiene 6400 nombres de calles. muc $ name se parece a:
muc$name = c("Berberichweg", "Otto-Klemperer-Weg", "Feldmeierbogen" , "Altostraße",...)
El otro vector es d_vector. Contiene alrededor de 1400 nombres.
d_vector = "Abel", "Abendroth", "von Abercron", "Abetz", "Abicht", "Abromeit", ...
Quiero encontrar todos los nombres de las calles, que contienen un nombre de d_vector en algún lugar del nombre de la calle.
Primero, hice algunas adaptaciones generales después de importar los datos csv (como variable d):
d_vector <- unlist(d$name) d_vector <- as.vector(as.matrix(d_vector))
result <- unique(grep(paste(d_vector, collapse="|"), muc$Name, value=TRUE, ignore.case = TRUE)) result
Pero el resultado devuelve todos los nombres de las calles.
También traté de usar agrep, que reajustó unOut of memory
-Error.
Cuando intentéd_vector %in% muc$name
devolvió solo un VERDADERO y cientos de FALSO, lo que no parece correcto.
¿Tiene alguna sugerencia sobre dónde podría estar mi error o qué biblioteca podría usar? Estoy buscando algo como "fuzzywuzzy" de python para R