Как lucene индексирует документы?

Question

Apr 08, 2010, 07:51 PM

Как lucene индексирует документы?

Я прочитал какой-то документ о Lucene; также читаю документ по этой ссылке (http://lucene.sourceforge.net/talks/pisa).

Я не очень понимаю, как Lucene индексирует документы, и не понимаю, какие алгоритмы Lucene использует для индексации?

В приведенной выше ссылке говорится, что Lucene использует этот алгоритм для индексации:

инкрементальный алгоритм:поддерживать стек индексов сегментасоздать индекс для каждого входящего документапомещать новые индексы в стекпусть b = 10 - коэффициент слияния; М = 8

for (size = 1; size < M; size *= b) {
    if (there are b indexes with size docs on top of the stack) {
        pop them off the stack;
        merge them into a single index;
        push the merged index onto the stack;
    } else {
        break;
    }
}

Как этот алгоритм обеспечивает оптимизированную индексацию?

Использует ли Lucene алгоритм B-дерева или любой другой алгоритм для индексации, или же у него есть определенный алгоритм?

Как lucene индексирует документы?

Ответы на вопрос(4)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

Как lucene индексирует документы?

Ответы на вопрос(4)

Ваш ответ на вопрос

Популярные вопросы