Создать уникальный идентификатор путем нечеткого сопоставления имен (через agrep с использованием R)
Используя R, я пытаюсь сопоставить людейимена в наборе данных, структурированные по году и городу. Из-за некоторых орфографических ошибок точное совпадение невозможно, поэтому я пытаюсь использовать agrep () для нечетких имен совпадений.
Примерный фрагмент набора данных имеет следующую структуру:
df