Wie parse ich HTML mit nutch und indexspezifischem Tag auf solr?

Ich habe Nutch und Solr installiert, um eine Website zu crawlen und darin zu suchen. Wie Sie wissen, können wir Meta-Tags von Webseiten mit dem Meta-Tags-Parsing-Plugin von Nutch in solr indizieren Solr das ist nicht Meta? (Plugin oder sowieso) wie folgt:

<div id=something>
      me specific tag
</div>

In der Tat möchte ich ein Feld zu Solr (etwas) hinzufügen, das den Wert "mir bestimmten Tag" auf dieser Seite hat.

irgendeine Idee?

Antworten auf die Frage(4)

Ihre Antwort auf die Frage