Результаты поиска по запросу "fuzzy-search"
для пользователя, чем Soundex.
сноэтот комментируя в связанной ветке, я хотел бы знать, почему методы, основанные на расстоянии Левенштейна, лучше, чем Soundex.
Q-грамма приближенного соответствия оптимизаций
У меня есть таблица, содержащая 3 миллиона записей о людях, по которым я хочу выполнить нечеткое сопоставление, используя q-граммы (например, по фамилии). Я создал таблицу из 2 граммов, ссылающихся на это, но производительность поиска на этом ...
(не ваша вина, просто кажется, что должен быть более чистый путь), это единственная рабочая реализация, которую я нашел. Спасибо!
ы получаете соответствующий нечеткий термин и его смещение при использовании Lucene Fuzzy Search? IndexSearcher mem = ....(some standard code) QueryParser parser = new QueryParser(Version.LUCENE_30, CONTENT_FIELD, analyzer); TopDocs topDocs ...
Онлайн-сервис использует таблицы поиска для хранения синонимов, а также истории сопоставления вручную. Это позволяет улучшить автоматизацию сопоставления данных при следующем импорте новых данных.
ужно автоматически сопоставить названия продуктов (камеры, ноутбуки, телевизоры и т. Д.), Которые поступают из разных источников, с каноническим именем в базе данных. Например"Canon PowerShot a20IS", "НОВЫЙ PowerShot A20 IS от Canon"а ...
Какое самое простое приложение для поиска по сайту, которое поддерживает нечеткий поиск?
У меня есть сайт, по которому нужно искать записи по 20-30 тыс., В основном это названия фильмов и телешоу. Сайт запускает php / mysql с memcache. Я ищу заменитьFULLTEXT с участиемsoundex() поиск, который у меня сейчас есть, который работает ... ...
Нечеткое слияние / совпадение Python Pandas с дубликатами
У меня есть 2 кадра данных, 1 для доноров и 1 для сборщиков средств. В идеале я пытаюсь найти, собирают ли пожертвования какие-либо пожертвования и если да, скопировать часть этой информации в мой набор данных по сбору средств (имя донора, ...
Быстрый нечеткий / приблизительный поиск по словарю строк в Ruby
У меня есть словарь строк от 50K до 100K (может быть до 50+ символов), и я пытаюсь найти, находится ли данная строка в словаре с некоторым «редактированием» допуска на расстояние. (Левенштейн например). Я прекрасно предварительно вычисляю любой ...
Нечеткое сопоставление с использованием T-SQL
У меня есть столлицс личными данными и так далее. Есть много столбцов, но один из интересных здесь:addressindex, lastname а такжеfirstname гдеaddressindex это уникальный адрес, просверленный до двери квартиры. Так что, если у меня есть «как ...
Solr Fuzzy Поиск похожих слов
Я пытаюсь сделать нечеткий поиск "jahngir" ~ 0.2, который не дает никаких результатов. В моих индексах есть записи с данными "JAHANGIR RAHMAN MD". Если я попробую поиск с точным словом "jahangir" ~ 0.2, это сработает. Может кто-нибудь, ...
Нечеткий поиск в JavaScript
Я работаю над этим фильтром, где у меня около 50-100 пунктов списка. И у каждого элемента есть разметка вот так: <li> <input type="checkbox" name="services[]" value="service_id" /> <span class="name">Restaurant in NY</span> <span ...