Результаты поиска по запросу "lucene"
Использование Lucene как реляционной базы данных
Мне просто интересно, сможем ли мы достичь некоторых возможностей RDBMS в lucene. Пример: 1) У меня есть 10 000 проектных документов (PDF-файлы), которые должны быть проиндексированы вместе с их содержанием, чтобы сделать их доступными ...
Solr - выделить фразу запроса
Можно ли выделить целые условия запроса? F.E. когда я прошу"Соединенные Штаты"Я хочу получить: <em>United States</em>и нет: <em>United</em> <em>States</em>Я искал ответ во всем Интернете, использовал все комбинацииhl.mergeContiguous, ...
Solr Filter Cache (FastLRUCache) занимает слишком много памяти и приводит к нехватке памяти?
У меня есть настройка Solr. Один хозяин и два раба для репликации. У нас есть около 70 миллионов документов в индексе. Рабы имеют 16 ГБ оперативной памяти. 10 ГБ для ОС и HD, 6 ГБ для Solr. Но время от времени рабам не хватает памяти. Когда мы ...
С Lucene: Почему я получаю ошибку Too Many Clauses, если я делаю поиск по префиксу?
У меня было приложение, выполняющее поиск префикса некоторое время. Недавно размер индекса был увеличен, и оказалось, что некоторые префиксы были слишком чертовски многочисленны для того, чтобы обрабатывать их. Это продолжало бросать меняСлишком ...
ElasticSearch - вернуть полное значение фасета для запроса
Я недавно начал использовать ElasticSearch. Я пытаюсь завершить некоторые варианты использования. У меня есть проблема для одного из них. Я проиндексировал некоторых пользователей с их полным именем (например, «Жан-Поль Готье», ...
Добавление многозначного строкового поля в документ Lucene, имеет ли значение запятая?
Я создаю индекс Lucene и добавляю документы. У меня есть многозначное поле, в этом примере я буду использовать Категории. Предмет может иметь много категорий, например, Джинсы могут быть в категории Одежда, Брюки, Мужчины, Женщины и т. Д. При ...
Какова лучшая настройка Lucene для ранжирования точных совпадений как самых высоких?
Какие анализаторы следует использовать для индексации и поиска, когда я хочу, чтобы точное совпадение оценивалось выше, чем «частичное» совпадение? Возможно настроить пользовательскую оценку вSimilarity класс? Например, когда мой индекс состоит ...
Повышение условий Lucene при построении индекса
Можно ли определить, что конкретные термины важнее других при создании индекса (а не при его запросе)? Рассмотрим, например, фильтр синонимов: док 1: «это хорошая машина» док 2: «это хороший автомобиль» Я хочу добавить термин «транспортное ...
Lucene: словосочетания в качестве поисковых терминов
Я пытаюсь сделать доступный для поиска телефон / местный бизнес-справочник, используя Apache Lucene. У меня есть поля для названия улицы, названия компании, номера телефона и т. Д. Проблема, с которой я сталкиваюсь, заключается в том, что когда ...
Используя комбинацию подстановочных знаков и стемминга
Я использую анализатор снежного кома для определения заголовков нескольких документов. Все работает хорошо, но есть свои причуды. Пример: Поиск по «valv», «valve» или «valve» возвращает одинаковое количество результатов. Это имеет смысл, ...