Результаты поиска по запросу "fuzzy-search"
Какое самое простое приложение для поиска по сайту, которое поддерживает нечеткий поиск?
У меня есть сайт, по которому нужно искать записи по 20-30 тыс., В основном это названия фильмов и телешоу. Сайт запускает php / mysql с memcache. Я ищу заменитьFULLTEXT с участиемsoundex() поиск, который у меня сейчас есть, который работает ... ...
Проверка нечеткой / приблизительной подстроки, существующей в более длинной строке, в Python?
Используя такие алгоритмы, как leveinstein (leveinstein или difflib), легко найти приблизительные совпадения. >>> import difflib >>> difflib.SequenceMatcher(None,"amazing","amaging").ratio() 0.8571428571428571Нечеткие совпадения могут быть ...
Нечеткое объединение SQL - MSSQL
У меня есть два набора данных. Существующие клиенты и потенциальные клиенты.Моя главная цель - выяснить, есть ли среди потенциальных клиентов уже существующи...
Нечеткое совпадение строк в Python
У меня есть 2 списка из более чем миллиона имен с немного различными соглашениями об именах. Цель здесь - сопоставить те записи, которые похожи, с логикой 95...
для пользователя, чем Soundex.
сноэтот комментируя в связанной ветке, я хотел бы знать, почему методы, основанные на расстоянии Левенштейна, лучше, чем Soundex.
Нечеткое слияние / совпадение Python Pandas с дубликатами
У меня есть 2 кадра данных, 1 для доноров и 1 для сборщиков средств. В идеале, что яЯ пытаюсь выяснить, делали ли какие-либо сборщики денег пожертвования, и ...
Быстрый нечеткий / приблизительный поиск по словарю строк в Ruby
У меня есть словарь строк от 50K до 100K (может быть до 50+ символов), и я пытаюсь найти, есть ли данная строка в словаре с некоторыми "редактировать&qu...
Онлайн-сервис использует таблицы поиска для хранения синонимов, а также истории сопоставления вручную. Это позволяет улучшить автоматизацию сопоставления данных при следующем импорте новых данных.
ужно автоматически сопоставить названия продуктов (камеры, ноутбуки, телевизоры и т. Д.), Которые поступают из разных источников, с каноническим именем в базе данных. Например"Canon PowerShot a20IS", "НОВЫЙ PowerShot A20 IS от Canon"а ...