Как построить простой перевернутый индекс?
Я хочу создать простую функцию индексации поисковой системы без какого-либо API, например, Lucene. В инвертированном индексе мне просто нужно записать основную информацию о каждом слове, например, docID, должность и частота.
Теперь у меня есть несколько вопросов:
Какая структура данных часто используется для построения инвертированного индекса? Многомерный список?
После построения индекса, как записать его в файлы? Что за формат в файле? Как стол? Как рисовать индексную таблицу на бумаге?