Соответствие нечетких строк
У меня есть две таблицы, которые мне нужно объединить в PostgreSQL, с общей переменной «название компании». К сожалению, многие из названий компаний не совпадают точно (т.е. MICROSOFT в одной таблице, MICROSFT в другой). Я попытался удалить общие слова из обоих столбцов, таких как «корпорация» или «inc» или «ltd», чтобы попытаться стандартизировать имена в обеих таблицах, но у меня возникают проблемы при рассмотрении дополнительных стратегий. Есть идеи?
Благодарю.
Также при необходимости я могу сделать это в R.