Результаты поиска по запросу "lucene"

3 ответа

Полнотекстовый поиск и Python

Может кто-нибудь помочь мне с некоторыми предложениями для механизма полнотекстового поиска, который поддерживает Python? Прямо сейчас у нас есть база данных MySQL, и я хотел бы добавить возможность индексирования полнотекстовой поисковой ...

1 ответ

Извлечение векторов TF-IDF с люценом

Я проиндексировал набор документов, используя lucene. Я также сохранил DocumentTermVector для каждого содержимого документа. Я написал программу и получил термин вектор частоты для каждого документа, но как я могу получить вектор tf-idf для ...

3 ответа

Как классифицировать документы, проиндексированные с помощью lucene

Я классифицировал набор документов с Lucene (поля: содержание, категория). Каждый документ имеет свою собственную категорию, но некоторые из них помечены как некатегоризованные. Есть ли способ легко классифицировать эти документы в Java?

ТОП публикаций

1 ответ

Как установить поле для сохранения уникальности строки в люцене?

Мое приложение генерирует уникальный идентификатор для каждой строки для индексации в lucene и сохранения в базе данных. Один вариант - если есть и строка имеет одинаковый идентификатор, я хочу обновить его, а не вставлять новую строку и ...

3 ответа

как добиться нумерации страниц в люцене?

Хотите знать, как добиться нумерации страниц в Lucene, так как он не поддерживает разбиение на страницы? Мне в основном нужно искать «10 лучших записей» (на основе какого-либо параметра), затем «следующие 10 записей» и так далее. И в то же время ...

1 ответ

длина документа в люцене 4.0

как я прочитал документацию по lucene 4.0, теперь эта библиотека хранит некоторую статистику для вычисления различных моделей скоринга, одна из которых bm25. Есть ли способ, кроме получения документа, также получить его длину?

4 ответа

Поиск точного соответствия с помощью API поиска Lucene

Я работаю над API поиска компаний, используя Lucene. В моем индексе компании Lucene есть 2 компании: 1.Abigail Adams National Bancorp, Inc. 2.Национальный Bancorp Если пользователь вводит данные в National Bancorp, то должна быть ...

3 ответа

Lucene: как получить оценку документа

Я хочу вывести оценку документов. Код, который я пишу для этого: IndexReader reader = IndexReader.open(FSDirectory.open(indexDir)); IndexSearcher searcher = new IndexSearcher(reader); Analyzer analyzer = new IKAnalyzer(); QueryParser parser = ...

2 ответа

Lucene: как усилить какое-то конкретное поле

В моем случае документы имеют два поля, например, «title» и «views». "views" - это количество посещений этого документа людьми. как: "title": "iphone", "views": "10". Мне нужно разработать стратегию, которая будет присваивать просмотрам несколько ...

1 ответ

Как восстановить поврежденный люценовый индекс?

У моего сервера была потеря питания и индекс lucene был поврежден. Я запустил IndexChecker, но он не работает: java -cp /home/dthoai/programs/paesia/checker/lucene-core-3.5.0.jar -ea:org.apache.lucene... ...