CFG с использованием POS-тегов в NLTK [закрыто]
Я пытаюсь проверить, является ли данное предложениеграмматический используя NLTK.
Пример:
ОК: кит лижет печаль
НЕ ОК: лучшее, что я когда-либо имел
Я знаю, что могу сделать POS-тегирование, затем использовать синтаксический анализатор CFG и проверить этот способ, но мне еще предстоит найти CFG, который использует POS-теги вместо реальных слов в качестве терминальных ветвей.
Есть ли CFG, который кто-нибудь может порекомендовать? Я думаю, что делать свое собственное глупо, потому что я не лингвист и, вероятно, опущу важные структуры.
Кроме того, мое приложение таково, что система в идеале отклоняет многие предложения и одобряет только те предложения, в которых она абсолютно уверена.
Спасибо