Каков относительно простой способ определить вероятность того, что предложение написано на английском языке?
У меня есть несколько строк (наборов символов), которые представляют предложения на разных языках, скажем:
Здравствуйте, меня зовут Джордж.
Das brot ist gut.
... так далее.
Я хочу присвоить каждому из них баллы (от 0 до 1), указывающие на вероятность того, что они являются английскими предложениями. Есть ли принятый алгоритм (или библиотека Python) для этого?
Примечание: я нене волнует, если грамматика английского предложения идеально.