Zugmodell mit benannter Entität

Ich suche auf Standford Corenlp mit dem Named Entity REcognizer.Ich habe verschiedene Arten von Eingabetext und ich muss ihn in meine eigene Entität taggen.So fing ich an, mein eigenes Modell zu trainieren und es scheint nicht zu funktionieren.

Zum Beispiel: Mein Eingabetext lautet "Book of 49 Magazine Articles on Toyota Land Cruiser 1956-1987 Gold Portfoliohttp: //t.co/EqxmY1VmL http: //t.co/F0Vefuoj9"

Ich gehe die Beispiele durch, um meine eigenen Modelle zu trainieren, und suche nur nach einigen Wörtern, die mich interessieren.

Meine jane-austen-emma-ch1.tsv sieht so aus

Toyota  PERS
Land Cruiser    PERS

Aus dem obigen Eingabetext interessieren mich nur diese beiden Wörter. Der eine ist Toyota und das andere Wort ist Land Cruiser.

The austin.prop sehen so aus

trainFile = jane-austen-emma-ch1.tsv
serializeTo = ner-model.ser.gz
map = word=0,answer=1
useClassFeature=true
useWord=true
useNGrams=true
noMidNGrams=true
useDisjunctive=true
maxNGramLeng=6
usePrev=true
useNext=true
useSequences=true
usePrevSequences=true
maxLeft=1
useTypeSeqs=true
useTypeSeqs2=true
useTypeySequences=true
wordShape=chris2useLC

Führen Sie den folgenden Befehl aus, um die Datei ner-model.ser.gz zu generieren.

java -cp stanford-corenlp-3.4.1.jar edu.stanford.nlp.ie.crf.CRFClassifier -prop austen.prop

public static void main(String[] args) {
        String serializedClassifier = "edu/stanford/nlp/models/ner/english.muc.7class.distsim.crf.ser.gz";
        String serializedClassifier2 = "C:/standford-ner/ner-model.ser.gz";
        try {
            NERClassifierCombiner classifier = new NERClassifierCombiner(false, false, 
                    serializedClassifier2,serializedClassifier);
            String ss = "Book of 49 Magazine Articles on Toyota Land Cruiser 1956-1987 Gold Portfolio http://t.co/EqxmY1VmLg http://t.co/F0Vefuoj9Q";
            System.out.println("---");
            List<List<CoreLabel>> out = classifier.classify(ss);
            for (List<CoreLabel> sentence : out) {
              for (CoreLabel word : sentence) {
                System.out.print(word.word() + '/' + word.get(AnswerAnnotation.class) + ' ');
              }
              System.out.println();
            }

        } catch (ClassCastException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }  catch (Exception e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }

    }

Hier ist die Ausgabe, die ich bekomme

Book/PERS of/PERS 49/O Magazine/PERS Articles/PERS on/O Toyota/PERS Land/PERS Cruiser/PERS 1956-1987/PERS Gold/O Portfolio/PERS http://t.co/EqxmY1VmLg/PERS http://t.co/F0Vefuoj9Q/PERS

ch bin auf der Suche nach Toyota / PERS und Land Cruiser / PER

Vielen Dank für die Hilfe. Jede Hilfe wird sehr geschätzt.