Przetwarzanie języka naturalnego: znajdź wulgaryzmy w języku angielskim?

Biorąc pod uwagę zestaw słów oznaczonych jako część mowy, chcę znaleźć te, które są nieprzyzwoite w głównym nurcie angielskiego. Jak mogę to zrobić? Czy powinienem po prostu zrobić wielką listę i sprawdzić, czy na liście jest coś? Czy powinienem próbować użyć wyrażenia regularnego, aby przechwycić kilka odmian jednego roota?

Jeśli to ułatwi, nie chcę odfiltrowywać, tylko po to, by liczyć. Więc jeśli są jakieś fałszywe alarmy, nie jest to koniec świata, o ile istnieje mniej więcej równomiernie ponad przesadną szybkością.

questionAnswers(11)

yourAnswerToTheQuestion