NLTK o nazwie rozpoznanie jednostki w języku holenderskim

Question

Jul 02, 2012, 01:54 PM

nltk python nlp named-entity-recognition

NLTK o nazwie rozpoznanie jednostki w języku holenderskim

Próbuję wyodrębnić nazwane elementy z holenderskiego tekstu. użyłemtrener nltk trenować tagger i chunker w holenderskim korpusie Conll2002. Jednak metoda analizowania z chunkera nie wykrywa żadnych nazwanych jednostek. Oto mój kod:

str = 'Christiane heeft een lam.'

tagger = nltk.data.load('taggers/dutch.pickle')
chunker = nltk.data.load('chunkers/dutch.pickle')

str_tags = tagger.tag(nltk.word_tokenize(str))
print str_tags

str_chunks = chunker.parse(str_tags)
print str_chunks

I wynik tego programu:

[('Christiane', u'N'), ('heeft', u'V'), ('een', u'Art'), ('lam', u'Adj'), ('.', u'Punc')]
(S Christiane/N heeft/V een/Art lam/Adj ./Punc)

Spodziewałem się, że Christiane zostanie wykryta jako nazwana jednostka. Jakaś pomoc?

questionAnswers(1)

Popularne pytania

0 odpowiedzi

Jak uzyskać ikonę powiązaną z określonym kontem z konta AccountManager.getAccounts ()

0 odpowiedzi

Czy w tym przypadku wymagana jest pętla wiadomości STA?

0 odpowiedzi

Najlepsza praktyka dla kluczowych wartości w plikach tłumaczeń

0 odpowiedzi

Czarne paski z adapterem HDMI na iPadzie 2

0 odpowiedzi

Python ElementTree nie konwertuje spacji niełamujących podczas korzystania z UTF-8 dla danych wyjściowych

Jesteś bardzo aktywny! To świetnie!

NLTK o nazwie rozpoznanie jednostki w języku holenderskim

questionAnswers(1)

yourAnswerToTheQuestion

Popularne pytania