Jaki jest stosunkowo prosty sposób określenia prawdopodobieństwa, że zdanie jest w języku angielskim?
Mam kilka ciągów znaków (kolekcji znaków), które reprezentują zdania w różnych językach, na przykład:
Cześć mam na imię George.
Das brot ist gut.
... itd.
Chcę przypisać każdemu z nich wyniki (od 0 .. 1) wskazujące na prawdopodobieństwo, że są to zdania angielskie. Czy istnieje zaakceptowany algorytm (lub biblioteka Pythona), z którego można to zrobić?
Uwaga: Nie obchodzi mnie, czy gramatyka angielskiego zdania jest idealna.