Я смог соединить два набора данных, используя пакет fuzzylogic:

аюсь сделать нечеткое логическое объединение в R между двумя наборами данных:

первый набор данных имеет название местоположения и столбец с именемconfigВторой набор данных имеет имя местоположения и два дополнительных атрибута, которые необходимо суммировать, прежде чем они будут присоединены к первому набору данных.

Я хотел бы использоватьname столбец для объединения двух наборов данных. Тем не менееname Столбец может содержать дополнительные или начальные символы в наборе данных или содержать одно слово внутри большего слова. Так, например, если мы посмотрим на эти два набора данных, я бы хотел, чтобы имя OPAL присоединилось к OPALAS, а SAUSALITO Y - к SAUSALITO.

Dataset1:    
     Name           Config
     ALTO D         BB
     CONTRA         ST
     EIGHT A        DD
     OPALAS         BB
     SAUSALITO Y    AA
     SOLANO J       ST

Dataset2:    
    Name       Age     Rank
    ALTO D     50      2
    ALTO D     20      6
    CONTRA     10      10
    CONTRA     15      15
    EIGHTH     18      21
    OPAL       19      4
    SAUSALITO  2       12
    SOLANO     34      43

Код для подведения итогов Dataset2

Data2a <-summaryBy(Age ~ Name,FUN=c(mean), data=Data2,na.rm=TRUE)
Data2b<-summaryBy(Rank ~ Name,FUN=c(sum), data=Data2,na.rm=TRUE)
Data2<-data.frame(Data2a$Name, Data2a$Age.mean, Data2b$Rank.sum)

Desired Outcome:
    Name        Config  Age   Rank
    ALTO D      BB      35    8
    CONTRA      ST      12.5  25
    EIGHT A     DD      18    21
    OPALAS      BB      19    4
    SAUSALITO Y AA      12    5
    SOLANO J    ST      34    43

Ответы на вопрос(1)

Ваш ответ на вопрос