проверить, все ли символы одной строки существуют в другой строке в r
Я пытаюсь сравнить строки какPRABHAKAR SHARMA
а такжеSHARMA KUMAR PRABHAKAR
, намерение состоит в том, чтобы проверить, существуют ли все символы более короткой строки в другой строке. Если это так, я должен получить 100% совпадение, иначе процент, представляющий процент совпадений символов.
Я пытался с помощьюlevenshteinSim
вRecordLinkage
пакет, но он дает число, соответствующее количеству изменений, необходимых для изменения одной строки в другую.
install.packages("RecordLinkage")
require(RecordLinkage)
levenshteinSim("PRABHAKAR SHARMA","SHARMA KUMAR PRABHAKAR")
#[1] 0.3636364
Я хочу 100% совпадение в таком случае. Кроме того, это должно быть воспроизведено для более чем 1 000 000 записей.