Результаты поиска по запросу "fuzzy-search"

4 ответа

 для пользователя, чем Soundex.

сноэтот комментируя в связанной ветке, я хотел бы знать, почему методы, основанные на расстоянии Левенштейна, лучше, чем Soundex.

4 ответа

Q-грамма приближенного соответствия оптимизаций

У меня есть таблица, содержащая 3 миллиона записей о людях, по которым я хочу выполнить нечеткое сопоставление, используя q-граммы (например, по фамилии). Я создал таблицу из 2 граммов, ссылающихся на это, но производительность поиска на этом ...

1 ответ

 (не ваша вина, просто кажется, что должен быть более чистый путь), это единственная рабочая реализация, которую я нашел. Спасибо!

ы получаете соответствующий нечеткий термин и его смещение при использовании Lucene Fuzzy Search? IndexSearcher mem = ....(some standard code) QueryParser parser = new QueryParser(Version.LUCENE_30, CONTENT_FIELD, analyzer); TopDocs topDocs ...

ТОП публикаций

10 ответов

Онлайн-сервис использует таблицы поиска для хранения синонимов, а также истории сопоставления вручную. Это позволяет улучшить автоматизацию сопоставления данных при следующем импорте новых данных.

ужно автоматически сопоставить названия продуктов (камеры, ноутбуки, телевизоры и т. Д.), Которые поступают из разных источников, с каноническим именем в базе данных. Например"Canon PowerShot a20IS", "НОВЫЙ PowerShot A20 IS от Canon"а ...

4 ответа

Какое самое простое приложение для поиска по сайту, которое поддерживает нечеткий поиск?

У меня есть сайт, по которому нужно искать записи по 20-30 тыс., В основном это названия фильмов и телешоу. Сайт запускает php / mysql с memcache. Я ищу заменитьFULLTEXT с участиемsoundex() поиск, который у меня сейчас есть, который работает ... ...

2 ответа

Нечеткое слияние / совпадение Python Pandas с дубликатами

У меня есть 2 кадра данных, 1 для доноров и 1 для сборщиков средств. В идеале я пытаюсь найти, собирают ли пожертвования какие-либо пожертвования и если да, скопировать часть этой информации в мой набор данных по сбору средств (имя донора, ...

4 ответа

Быстрый нечеткий / приблизительный поиск по словарю строк в Ruby

У меня есть словарь строк от 50K до 100K (может быть до 50+ символов), и я пытаюсь найти, находится ли данная строка в словаре с некоторым «редактированием» допуска на расстояние. (Левенштейн например). Я прекрасно предварительно вычисляю любой ...

10 ответов

Нечеткое сопоставление с использованием T-SQL

У меня есть столлицс личными данными и так далее. Есть много столбцов, но один из интересных здесь:addressindex, lastname а такжеfirstname гдеaddressindex это уникальный адрес, просверленный до двери квартиры. Так что, если у меня есть «как ...

2 ответа

Solr Fuzzy Поиск похожих слов

Я пытаюсь сделать нечеткий поиск "jahngir" ~ 0.2, который не дает никаких результатов. В моих индексах есть записи с данными "JAHANGIR RAHMAN MD". Если я попробую поиск с точным словом "jahangir" ~ 0.2, это сработает. Может кто-нибудь, ...

8 ответов

Нечеткий поиск в JavaScript

Я работаю над этим фильтром, где у меня около 50-100 пунктов списка. И у каждого элемента есть разметка вот так: <li> <input type="checkbox" name="services[]" value="service_id" /> <span class="name">Restaurant in NY</span> <span ...