Unir dos conjuntos de datos usando lógica difusa en R
Estoy tratando de hacer una unión lógica difusa en R entre dos conjuntos de datos:
El primer conjunto de datos tiene el nombre de una ubicación y una columna llamadaconfig
El segundo conjunto de datos tiene el nombre de una ubicación y dos atributos adicionales que deben resumirse antes de unirse al primer conjunto de datos.Me gustaría usar elname
columna para unir entre los dos conjuntos de datos. Sin embargo, elname
la columna puede tener caracteres adicionales o iniciales en cualquier conjunto de datos o tener una palabra contenida dentro de una palabra más grande. Entonces, por ejemplo, si miramos estos dos conjuntos de datos, me gustaría que el nombre OPAL se uniera a OPALAS y SAUSALITO Y se uniera a SAUSALITO.
Dataset1:
Name Config
ALTO D BB
CONTRA ST
EIGHT A DD
OPALAS BB
SAUSALITO Y AA
SOLANO J ST
Dataset2:
Name Age Rank
ALTO D 50 2
ALTO D 20 6
CONTRA 10 10
CONTRA 15 15
EIGHTH 18 21
OPAL 19 4
SAUSALITO 2 12
SOLANO 34 43
Código para resumir el conjunto de datos2
Data2a <-summaryBy(Age ~ Name,FUN=c(mean), data=Data2,na.rm=TRUE)
Data2b<-summaryBy(Rank ~ Name,FUN=c(sum), data=Data2,na.rm=TRUE)
Data2<-data.frame(Data2a$Name, Data2a$Age.mean, Data2b$Rank.sum)
Desired Outcome:
Name Config Age Rank
ALTO D BB 35 8
CONTRA ST 12.5 25
EIGHT A DD 18 21
OPALAS BB 19 4
SAUSALITO Y AA 12 5
SOLANO J ST 34 43