Я смог соединить два набора данных, используя пакет fuzzylogic:
аюсь сделать нечеткое логическое объединение в R между двумя наборами данных:
первый набор данных имеет название местоположения и столбец с именемconfig
Второй набор данных имеет имя местоположения и два дополнительных атрибута, которые необходимо суммировать, прежде чем они будут присоединены к первому набору данных.Я хотел бы использоватьname
столбец для объединения двух наборов данных. Тем не менееname
Столбец может содержать дополнительные или начальные символы в наборе данных или содержать одно слово внутри большего слова. Так, например, если мы посмотрим на эти два набора данных, я бы хотел, чтобы имя OPAL присоединилось к OPALAS, а SAUSALITO Y - к SAUSALITO.
Dataset1:
Name Config
ALTO D BB
CONTRA ST
EIGHT A DD
OPALAS BB
SAUSALITO Y AA
SOLANO J ST
Dataset2:
Name Age Rank
ALTO D 50 2
ALTO D 20 6
CONTRA 10 10
CONTRA 15 15
EIGHTH 18 21
OPAL 19 4
SAUSALITO 2 12
SOLANO 34 43
Код для подведения итогов Dataset2
Data2a <-summaryBy(Age ~ Name,FUN=c(mean), data=Data2,na.rm=TRUE)
Data2b<-summaryBy(Rank ~ Name,FUN=c(sum), data=Data2,na.rm=TRUE)
Data2<-data.frame(Data2a$Name, Data2a$Age.mean, Data2b$Rank.sum)
Desired Outcome:
Name Config Age Rank
ALTO D BB 35 8
CONTRA ST 12.5 25
EIGHT A DD 18 21
OPALAS BB 19 4
SAUSALITO Y AA 12 5
SOLANO J ST 34 43