Formatieren NER Ausgabe von Stanford Corenlp

Ich arbeite mit Stanford CoreNLP und benutze es für NER. Aber wenn ich Organisationsnamen extrahiere, sehe ich, dass jedes Wort mit der Anmerkung markiert ist. Wenn die Entität "NEW YORK TIMES" ist, wird sie als drei verschiedene Entitäten aufgezeichnet: "NEW", "YORK" und "TIMES". Gibt es eine Eigenschaft, die wir im Stanford COreNLP festlegen können, um die kombinierte Ausgabe als Entität zu erhalten?

Genau wie in Stanford NER können wir bei Verwendung des Befehlszeilenprogramms das Ausgabeformat wie folgt auswählen: inlineXML? Können wir irgendwie eine Eigenschaft festlegen, um das Ausgabeformat in Stanford CoreNLP auszuwählen?

Antworten auf die Frage(8)

Ihre Antwort auf die Frage