NLTK Context Free Грамматическое Поколение
Я работаю над неанглийским парсером с символами Unicode. Для этого я решил использовать NLTK.
Но это требует предопределенной контекстно-свободной грамматики, как показано ниже:
S -> NP VP
VP -> V NP | V NP PP
PP -> P NP
V -> "saw" | "ate" | "walked"
NP -> "John" | "Mary" | "Bob" | Det N | Det N PP
Det -> "a" | "an" | "the" | "my"
N -> "man" | "dog" | "cat" | "telescope" | "park"
P -> "in" | "on" | "by" | "with"
В моем приложении я должен минимизировать жесткое кодирование с использованием основанной на правилах грамматики. Например, я могу предположить любое слово, заканчивающееся на-ed или же-ную как глагол. Так что это должно работать для любого контекста.
Как я могу передать такие правила грамматики в NLTK? Или генерировать их динамически, используя конечный автомат?