Treinar modelo usando entidade nomeada

Estou usando o Corenlp Standford usando o REEDERNITY Entity.Nome tenho diferentes tipos de texto de entrada e preciso marcá-lo em minha própria entidade.Então, comecei a treinar meu próprio modelo e ele parece não estar funcionando.

Por exemplo: minha string de texto de entrada é "Livro de 49 artigos de revista sobre o Toyota Land Cruiser 1956-1987 Gold Portfoliohttp://t.co/EqxmY1VmLg http://t.co/F0Vefuoj9Q"

Examino os exemplos para treinar meus próprios modelos e procuro apenas algumas palavras nas quais estou interessado.

Meu jane-austen-emma-ch1.tsv aparece assim

Toyota  PERS
Land Cruiser    PERS

A partir do texto de entrada acima, estou interessado apenas nessas duas palavras. O primeiro é Toyota e a outra palavra é Land Cruiser.

O austin.prop fica assim

trainFile = jane-austen-emma-ch1.tsv
serializeTo = ner-model.ser.gz
map = word=0,answer=1
useClassFeature=true
useWord=true
useNGrams=true
noMidNGrams=true
useDisjunctive=true
maxNGramLeng=6
usePrev=true
useNext=true
useSequences=true
usePrevSequences=true
maxLeft=1
useTypeSeqs=true
useTypeSeqs2=true
useTypeySequences=true
wordShape=chris2useLC

Execute o seguinte comando para gerar o arquivo ner-model.ser.gz

java -cp stanford-corenlp-3.4.1.jar edu.stanford.nlp.ie.crf.CRFClassifier -prop austen.prop

public static void main(String[] args) {
        String serializedClassifier = "edu/stanford/nlp/models/ner/english.muc.7class.distsim.crf.ser.gz";
        String serializedClassifier2 = "C:/standford-ner/ner-model.ser.gz";
        try {
            NERClassifierCombiner classifier = new NERClassifierCombiner(false, false, 
                    serializedClassifier2,serializedClassifier);
            String ss = "Book of 49 Magazine Articles on Toyota Land Cruiser 1956-1987 Gold Portfolio http://t.co/EqxmY1VmLg http://t.co/F0Vefuoj9Q";
            System.out.println("---");
            List<List<CoreLabel>> out = classifier.classify(ss);
            for (List<CoreLabel> sentence : out) {
              for (CoreLabel word : sentence) {
                System.out.print(word.word() + '/' + word.get(AnswerAnnotation.class) + ' ');
              }
              System.out.println();
            }

        } catch (ClassCastException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }  catch (Exception e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }

    }

Aqui está a saída que estou recebendo

Book/PERS of/PERS 49/O Magazine/PERS Articles/PERS on/O Toyota/PERS Land/PERS Cruiser/PERS 1956-1987/PERS Gold/O Portfolio/PERS http://t.co/EqxmY1VmLg/PERS http://t.co/F0Vefuoj9Q/PERS

O que eu acho que está errado. Estou procurando Toyota / PERS e Land Cruiser / PERS (que é um fied multi-valorizado.

Obrigado pela ajuda. Qualquer ajuda é realmente apreciada.

questionAnswers(2)

yourAnswerToTheQuestion