Unindo dois conjuntos de dados usando lógica difusa em R
Estou tentando fazer uma junção lógica difusa no R entre dois conjuntos de dados:
O primeiro conjunto de dados tem o nome de um local e uma coluna chamadaconfig
O segundo conjunto de dados tem o nome de um local e dois atributos adicionais que precisam ser resumidos antes de serem associados ao primeiro conjunto de dados.Eu gostaria de usar oname
coluna para ingressar entre os dois conjuntos de dados. No entanto, oname
A coluna pode ter caracteres adicionais ou iniciais no conjunto de dados ou ter uma palavra contida em uma palavra maior. Por exemplo, se olharmos para esses dois conjuntos de dados, gostaria que o nome OPAL se juntasse ao OPALAS e SAUSALITO Y se juntasse ao SAUSALITO.
Dataset1:
Name Config
ALTO D BB
CONTRA ST
EIGHT A DD
OPALAS BB
SAUSALITO Y AA
SOLANO J ST
Dataset2:
Name Age Rank
ALTO D 50 2
ALTO D 20 6
CONTRA 10 10
CONTRA 15 15
EIGHTH 18 21
OPAL 19 4
SAUSALITO 2 12
SOLANO 34 43
Código para resumir o conjunto de dados2
Data2a <-summaryBy(Age ~ Name,FUN=c(mean), data=Data2,na.rm=TRUE)
Data2b<-summaryBy(Rank ~ Name,FUN=c(sum), data=Data2,na.rm=TRUE)
Data2<-data.frame(Data2a$Name, Data2a$Age.mean, Data2b$Rank.sum)
Desired Outcome:
Name Config Age Rank
ALTO D BB 35 8
CONTRA ST 12.5 25
EIGHT A DD 18 21
OPALAS BB 19 4
SAUSALITO Y AA 12 5
SOLANO J ST 34 43