jak parsować html z tagiem nutch i indeksem do solr?
zainstalowałem nutch i solr do przeszukiwania witryny i wyszukiwania w niej; jak wiesz, możemy indeksować meta tagi stron internetowych w solr za pomocą wtyczki nutch parse meta tags (http://wiki.apache.org/nutch/IndexMetatags) teraz chcę wiedzieć, czy istnieje jakiś sposób na indeksowanie innego tagu html do solr, który nie jest meta (wtyczka lub tak czy inaczej) w ten sposób:
<div id=something>
me specific tag
</div>
w istocie chcę dodać pole do solr (coś), które ma wartość „me konkretny tag” na tej stronie.
dowolny pomysł?