Indizierung von Wikipedia mit solr

Ich habe Solr 4.6.0 installiert und folge dem Tutorial auf der Solr-Homepage. Alles war in Ordnung, bis ich einen richtigen Job machen muss, den ich gleich machen werde. Ich muss einen schnellen Zugang zu Wikipedia-Inhalten haben, und mir wurde empfohlen, Solr zu verwenden. Nun, ich habe versucht, dem Beispiel im Link zu folgenhttp://wiki.apache.org/solr/DataImportHandler#Example:_Indexing_wikipedia, aber ich konnte das Beispiel nicht bekommen. Ich bin Neuling und weiß nicht, was data_config.xml bedeutet!

<dataConfig>
        <dataSource type="FileDataSource" encoding="UTF-8" />
        <document>
        <entity name="page"
                processor="XPathEntityProcessor"
                stream="true"
                forEach="/mediawiki/page/"
                url="/data/enwiki-20130102-pages-articles.xml"
                transformer="RegexTransformer,DateFormatTransformer"
                >
            <field column="id"        xpath="/mediawiki/page/id" />
            <field column="title"     xpath="/mediawiki/page/title" />
            <field column="revision"  xpath="/mediawiki/page/revision/id" />
            <field column="user"      xpath="/mediawiki/page/revision/contributor/username" />
            <field column="userId"    xpath="/mediawiki/page/revision/contributor/id" />
            <field column="text"      xpath="/mediawiki/page/revision/text" />
            <field column="timestamp" xpath="/mediawiki/page/revision/timestamp" dateTimeFormat="yyyy-MM-dd'T'hh:mm:ss'Z'" />
            <field column="$skipDoc"  regex="^#REDIRECT .*" replaceWith="true" sourceColName="text"/>
       </entity>
        </document>
</dataConfig>

Ich konnte im Solr-Ausgangsverzeichnis nichts finden. Außerdem habe ich versucht, einige Fragen zu meinen zu finden,So indizieren Sie Wikipedia-Dateien im XML-Format in solr undIndizierung von Wikipedia-Dumps mit solr, aber sie haben meinen Zweifel nicht gelöst.

Ich glaube, ich brauche etwas Grundlegenderes, das mich Schritt für Schritt führt, weil das Tutorial verwirrend ist, wenn es um die Indizierung von Wikipedia geht.

Jeder Ratschlag, dem Folgenden einige Anweisungen zu geben, wäre nett.

Antworten auf die Frage(2)

Ihre Antwort auf die Frage