извлечь отношения с помощью NLTK

Этопродолжение моего вопроса, Я использую nltk для анализа людей, организаций и их отношений. С помощьюэтот примерЯ был в состоянии создать куски людей и организаций; однако я получаю сообщение об ошибке в команде nltk.sem.extract_rel:

AttributeError: 'Tree' object has no attribute 'text'

Вот полный код:

import nltk
import re
#billgatesbio from http://www.reuters.com/finance/stocks/officerProfile?symbol=MSFT.O&officerId=28066
with open('billgatesbio.txt', 'r') as f:
    sample = f.read()

sentences = nltk.sent_tokenize(sample)
tokenized_sentences = [nltk.word_tokenize(sentence) for sentence in sentences]
tagged_sentences = [nltk.pos_tag(sentence) for sentence in tokenized_sentences]
chunked_sentences = nltk.batch_ne_chunk(tagged_sentences)

# tried plain ne_chunk instead of batch_ne_chunk as given in the book
#chunked_sentences = [nltk.ne_chunk(sentence) for sentence in tagged_sentences]

# pattern to find <person> served as <title> in <org>
IN = re.compile(r'.+\s+as\s+')
for doc in chunked_sentences:
    for rel in nltk.sem.extract_rels('ORG', 'PERSON', doc,corpus='ieer', pattern=IN):
        print nltk.sem.show_raw_rtuple(rel)

Этот пример очень похож на тот,дано в книге, но в примере используются подготовленные «разобранные документы», которые появляются из ниоткуда, и я не знаю, где найти тип объекта. Я также просматривал библиотеки git. Любая помощь приветствуется.

Моя конечная цель состоит в том, чтобы извлечь людей, организации, названия (даты) для некоторых компаний; затем создайте сетевые карты лиц и организаций.

Ответы на вопрос(3)

Ваш ответ на вопрос