NLTK Context Free Грамматическое Поколение

Я работаю над неанглийским парсером с символами Unicode. Для этого я решил использовать NLTK.

Но это требует предопределенной контекстно-свободной грамматики, как показано ниже:

  S -> NP VP
  VP -> V NP | V NP PP
  PP -> P NP
  V -> "saw" | "ate" | "walked"
  NP -> "John" | "Mary" | "Bob" | Det N | Det N PP
  Det -> "a" | "an" | "the" | "my"
  N -> "man" | "dog" | "cat" | "telescope" | "park"
  P -> "in" | "on" | "by" | "with" 

В моем приложении я должен минимизировать жесткое кодирование с использованием основанной на правилах грамматики. Например, я могу предположить любое слово, заканчивающееся на-ed или же-ную как глагол. Так что это должно работать для любого контекста.

Как я могу передать такие правила грамматики в NLTK? Или генерировать их динамически, используя конечный автомат?

Ответы на вопрос(4)

Ваш ответ на вопрос