Извлечь список лиц и организаций, использующих Stanford NER Tagger в NLTK

Question

Jun 05, 2015, 12:49 PM

python stanford-nlp nltk named-entity-recognition

Извлечь список лиц и организаций, использующих Stanford NER Tagger в NLTK

Я пытаюсь извлечь список лиц и организаций, использующих Stanford Named Entity Recognizer (NER) в Python NLTK. Когда я бегу:

from nltk.tag.stanford import NERTagger
st = NERTagger('/usr/share/stanford-ner/classifiers/all.3class.distsim.crf.ser.gz',
               '/usr/share/stanford-ner/stanford-ner.jar') 
r=st.tag('Rami Eid is studying at Stony Brook University in NY'.split())
print(r)

выход:

[('Rami', 'PERSON'), ('Eid', 'PERSON'), ('is', 'O'), ('studying', 'O'),
('at', 'O'), ('Stony', 'ORGANIZATION'), ('Brook', 'ORGANIZATION'),
('University', 'ORGANIZATION'), ('in', 'O'), ('NY', 'LOCATION')]

я хочу извлечь из этого списка всех лиц и организаций в этой форме:

Rami Eid
Sony Brook University

Я попытался перебрать список кортежей:

for x,y in i:
        if y == 'ORGANIZATION':
            print(x)

Но этот код печатает только каждую сущность по одному в строке:

Sony 
Brook 
University

С реальными данными может быть больше чем одна организация, люди в одном предложении, как я могу установить границы между различными организациями?

Извлечь список лиц и организаций, использующих Stanford NER Tagger в NLTK

Ответы на вопрос(6)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

Извлечь список лиц и организаций, использующих Stanford NER Tagger в NLTK

Ответы на вопрос(6)

Ваш ответ на вопрос

Популярные вопросы