снова доступен на CRAN (версия 0.4-9 по состоянию на 2016-05-02.

ользую функцию 'agrep' в R, которая возвращает вектор совпадений. Мне бы хотелось, чтобы функция, похожая на agrep, возвращала только лучшее совпадение или наилучшее совпадение при наличии связей В настоящее время я делаю это, используя функцию 'sdist ()' из пакета 'cba' для каждого элемента результирующего вектора, но это кажется очень избыточным.

/ edit: вот функция, которую я сейчас использую. Я хотел бы ускорить его, так как кажется излишним рассчитывать расстояние дважды.

library(cba)
word <- 'test'
words <- c('Teest','teeeest','New York City','yeast','text','Test')
ClosestMatch <- function(string,StringVector) {
  matches <- agrep(string,StringVector,value=TRUE)
  distance <- sdists(string,matches,method = "ow",weight = c(1, 0, 2))
  matches <- data.frame(matches,as.numeric(distance))
  matches <- subset(matches,distance==min(distance))
  as.character(matches$matches)
}

ClosestMatch(word,words)

Ответы на вопрос(2)

Ваш ответ на вопрос