Результаты поиска по запросу "lucene"

1 ответ

lucene index не получает синхронизацию, когда происходит какое-либо обновление в БД через спящий режим

Я работаю над некоторыми вещами POC наПоиск в спящем режиме на основе Lucene используя ниже env: Зимует-поисковые системы 4.4.2.Final.jarLucene-ядро-3.6.2.jarMySQL 5.5использование@Indexed аннотация по ...

3 ответа

Как было упомянуто Эриксоном в Lucene, термин «частотно-обратная частота документа» (TF-IDF) подобен косинусному подобию. Представьте, что у вас есть две сумки терминов в запросе и в документе. Это измерение точно соответствует только терминам, а после в контекст включается их семантически весовые коэффициенты. Термины с очень частым вхождением имеют меньший вес (важность), потому что вы можете найти их в большом количестве документов. Но серьезная проблема заключается в том, что косинусное сходство TF-IDF не столь устойчиво для более противоречивых данных, когда вам нужно вычислить сходство между запросом и документом, более надежным, например. опечатки, опечатки и фонетические ошибки. Потому что слова должны иметь точное совпадение.

аете, где я могу найти объяснение высокого уровняКласс сходства Lucene [http://lucene.apache.org/java/2_2_0/api/org/apache/lucene/search/Similarity.html] алгоритм. Я хотел бы понять это без необходимости расшифровывать все математические и ...

2 ответа

Удачи. :)

вляю этот вопрос еще раз, так как мой запрос не получил ответа. Я работаю над API поиска книг с помощью Lucene. Пользователь может искать книгу, название или поле описания которой содержит C.F.A ... Я использую StandardAnalyzer вместе со списком ...

ТОП публикаций

3 ответа

Можно ли использовать termDocs для получения PhraseFrequency?

твует ли быстрый и простой способ получения терминов частоты из индекса Lucene, не делая это черезTermVectorFrequencies класс, так как это занимает очень много времени для больших коллекций? Я имею в виду, есть ли что-то вродеTermEnum которая ...

6 ответов

 одним из основных комментаторов Lucene.

ы различные способы оптимизации производительности Lucene? Должен ли я использовать API кэширования для хранения своего поискового запроса lucene, чтобы сэкономить на накладных расходах на повторное построение запроса?

1 ответ

Существует ограничение в 2GM на размер объекта. Если ваша RAMDirecotry превышает это, вы получите исключение OutOfMemoryException, даже если у вас достаточно оперативной памяти.

мне следует использовать RAMDirectory от Lucene? Каковы его преимущества перед другими механизмами хранения? Наконец, где я могу найти простой пример кода?

3 ответа

Но это был бы поцелуй смерти, чтобы попытаться управлять данными с помощью SOLR. Цикл read-edit-update прекрасно работает с базами данных SQL, но это не то, чем занимается SOLR. SOLR - это быстрый, гибкий текстовый поиск. Вы можете прикрепить URL изображения в SOLR для удобства подготовки результатов поиска, используя неиндексированное поле.

тоящее время при запуске проекта веб / мобильного приложения, в котором поиск будет важной переменной. Лучше начать с Lucene с самого начала или быстро развернуть решение на основе MySQL и надеяться на лучшее?

1 ответ

Майк, спасибо. Это похоже на то, что я уже думал - приятно получить подтверждение.

пользуем Solr для поиска статей различной длины. Мы индексируем как описательные метаданные (название, автор, категория, ключевые слова и т. Д.), Так и полный текст статьи. Мы не повышаем релевантность во время индексации - все ...

2 ответа

Используйте функциональный запрос для повышения оценки в Solr

Я работал над Solr 4 для оптимизации моего рейтинга результатов Solr на основе рейтинга популярности, хранящегося в Index. Теперь, когда кто-то ищет, кроме рейтинга релевантности, я хочу влиять на рейтинг релевантности, используя рейтинг ...

3 ответа

Я нашел эту ссылку в своем поиске раньше, но я ищу решение Zend. Спасибо, хотя, потому что это подтверждает, что это может быть сделано.

ользую Zend_Search_Lucene для реализации поиска по сайту. Я создал отдельные индексы для разных типов данных (например, один для пользователей, один для сообщений и т. Д.). Результаты аналогично разделены по типу данных, однако есть опция «все», ...