Как lucene индексирует документы?
Я прочитал какой-то документ о Lucene; также читаю документ по этой ссылке (http://lucene.sourceforge.net/talks/pisa).
Я не очень понимаю, как Lucene индексирует документы, и не понимаю, какие алгоритмы Lucene использует для индексации?
В приведенной выше ссылке говорится, что Lucene использует этот алгоритм для индексации:
инкрементальный алгоритм:поддерживать стек индексов сегментасоздать индекс для каждого входящего документапомещать новые индексы в стекпусть b = 10 - коэффициент слияния; М = 8for (size = 1; size < M; size *= b) {
if (there are b indexes with size docs on top of the stack) {
pop them off the stack;
merge them into a single index;
push the merged index onto the stack;
} else {
break;
}
}
Как этот алгоритм обеспечивает оптимизированную индексацию?
Использует ли Lucene алгоритм B-дерева или любой другой алгоритм для индексации, или же у него есть определенный алгоритм?