NLTK benannte die Anerkennung von Unternehmen in Niederländisch

Question

Jul 02, 2012, 01:54 PM

nltk python nlp named-entity-recognition

NLTK benannte die Anerkennung von Unternehmen in Niederländisch

Ich versuche, benannte Entitäten aus niederländischem Text zu extrahieren. ich benutztenltk-trainer einen tagger und einen chunker auf dem niederländischen corpus conll2002 zu trainieren. Die Analysemethode vom Chunker erkennt jedoch keine benannten Entitäten. Hier ist mein Code:

str = 'Christiane heeft een lam.'

tagger = nltk.data.load('taggers/dutch.pickle')
chunker = nltk.data.load('chunkers/dutch.pickle')

str_tags = tagger.tag(nltk.word_tokenize(str))
print str_tags

str_chunks = chunker.parse(str_tags)
print str_chunks

Und die Ausgabe dieses Programms:

[('Christiane', u'N'), ('heeft', u'V'), ('een', u'Art'), ('lam', u'Adj'), ('.', u'Punc')]
(S Christiane/N heeft/V een/Art lam/Adj ./Punc)

Ich hatte erwartet, dass Christiane als eine benannte Entität erkannt wird. Irgendeine Hilfe?

Antworten auf die Frage(1)

Top Fragen

0 die antwort

praktische Beispiele verwenden dup oder dup2

0 die antwort

Einfachste Methode zum Abrufen von browserübergreifenden XmlHttpRequest

0 die antwort

Konstante Amortisationszeit

0 die antwort

Alle exponierten / verfügbaren Endpunkte des RestEasy-Service auflisten?

0 die antwort

Analysiere einen Beitrag für @username

Du bist sehr aktiv! Es ist großartig!

NLTK benannte die Anerkennung von Unternehmen in Niederländisch

Antworten auf die Frage(1)

Ihre Antwort auf die Frage

Top Fragen