Как разобрать HTML с Nutch и индексировать определенный тег для Solr?

Я установил Nutch и Solr для сканирования веб-сайта и поиска по нему; как вы знаете, мы можем индексировать метатеги веб-страниц в solr с помощью плагина разбора мета-тегов Nutch. (http://wiki.apache.org/nutch/IndexMetatags) теперь я хочу знать, есть ли способ отсканировать еще один HTML-тег в Solr, который нет мета? (плагин или в любом случае), как это:


      me specific tag

На самом деле я хочу добавить поле для Solr (что-то), которые имеют значение "мне конкретный тег на этой странице.

любая идея?

Ответы на вопрос(4)

Ваш ответ на вопрос