Как индексировать документы Word 2003, 2007 и 2010 с помощью Lucene.NET

Я пишу пользовательский индексатор Lucene.NET для включения индексации документов MS Word. Индексатор должен быть способен обрабатывать три последних выпуска MS Word: 2010, 2007 и 2003.

Планируется использовать сборки взаимодействия VSTO, установленные как часть VS2010, для извлечения текстового содержимого из документов.

Есть ли лучший способ реализовать индексацию документов Word? Означает ли это, что мне придется установить все три версии Word на сервере? Или просто Word 2010?

Инструменты / Окружающая среда:

Lucene.NET 2.3.1.3VS2010 / .NET 3.5Windows 2008 / IIS 7

Замечания: Подробнее о том, как это реализовать, см.Поиск по тексту в документах PDF или Word