ссылка не работает ...
я есть следующая таблица с 2 столбцами: ID и заголовок, содержащий более 500 000 записей. Например:
ID Title
-- ------------------------
1 Aliens
2 Aliens (1986)
3 Aliens vs Predator
4 Aliens 2
5 The making of "Aliens"
Мне нужно найти записи, которые очень похожи, и под этим я подразумеваю, что они отличаются на 3-6 букв, обычно это различие находится в конце заголовков. Поэтому я должен разработать запрос, который возвращает записи нет. 1,2 и 4. Я уже посмотрел на расстояние Левенштейна, но не знаю, как его применить. Также из-за количества записей запрос не должен занимать всю ночь.
Спасибо за любую идею или предложение