Результаты поиска по запросу "lucene"

5 ответов

Использование Lucene как реляционной базы данных

Мне просто интересно, сможем ли мы достичь некоторых возможностей RDBMS в lucene. Пример: 1) У меня есть 10 000 проектных документов (PDF-файлы), которые должны быть проиндексированы вместе с их содержанием, чтобы сделать их доступными ...

2 ответа

Solr - выделить фразу запроса

Можно ли выделить целые условия запроса? F.E. когда я прошу"Соединенные Штаты"Я хочу получить: <em>United States</em>и нет: <em>United</em> <em>States</em>Я искал ответ во всем Интернете, использовал все комбинацииhl.mergeContiguous, ...

2 ответа

Solr Filter Cache (FastLRUCache) занимает слишком много памяти и приводит к нехватке памяти?

У меня есть настройка Solr. Один хозяин и два раба для репликации. У нас есть около 70 миллионов документов в индексе. Рабы имеют 16 ГБ оперативной памяти. 10 ГБ для ОС и HD, 6 ГБ для Solr. Но время от времени рабам не хватает памяти. Когда мы ...

ТОП публикаций

3 ответа

С Lucene: Почему я получаю ошибку Too Many Clauses, если я делаю поиск по префиксу?

У меня было приложение, выполняющее поиск префикса некоторое время. Недавно размер индекса был увеличен, и оказалось, что некоторые префиксы были слишком чертовски многочисленны для того, чтобы обрабатывать их. Это продолжало бросать меняСлишком ...

2 ответа

ElasticSearch - вернуть полное значение фасета для запроса

Я недавно начал использовать ElasticSearch. Я пытаюсь завершить некоторые варианты использования. У меня есть проблема для одного из них. Я проиндексировал некоторых пользователей с их полным именем (например, «Жан-Поль Готье», ...

2 ответа

Добавление многозначного строкового поля в документ Lucene, имеет ли значение запятая?

Я создаю индекс Lucene и добавляю документы. У меня есть многозначное поле, в этом примере я буду использовать Категории. Предмет может иметь много категорий, например, Джинсы могут быть в категории Одежда, Брюки, Мужчины, Женщины и т. Д. При ...

2 ответа

Какова лучшая настройка Lucene для ранжирования точных совпадений как самых высоких?

Какие анализаторы следует использовать для индексации и поиска, когда я хочу, чтобы точное совпадение оценивалось выше, чем «частичное» совпадение? Возможно настроить пользовательскую оценку вSimilarity класс? Например, когда мой индекс состоит ...

1 ответ

Повышение условий Lucene при построении индекса

Можно ли определить, что конкретные термины важнее других при создании индекса (а не при его запросе)? Рассмотрим, например, фильтр синонимов: док 1: «это хорошая машина» док 2: «это хороший автомобиль» Я хочу добавить термин «транспортное ...

4 ответа

Lucene: словосочетания в качестве поисковых терминов

Я пытаюсь сделать доступный для поиска телефон / местный бизнес-справочник, используя Apache Lucene. У меня есть поля для названия улицы, названия компании, номера телефона и т. Д. Проблема, с которой я сталкиваюсь, заключается в том, что когда ...

4 ответа

Используя комбинацию подстановочных знаков и стемминга

Я использую анализатор снежного кома для определения заголовков нескольких документов. Все работает хорошо, но есть свои причуды. Пример: Поиск по «valv», «valve» или «valve» возвращает одинаковое количество результатов. Это имеет смысл, ...