Verarbeitung natürlicher Sprachen: Finden Sie Obszönitäten auf Englisch?

Angesichts einer Reihe von Wörtern, die für einen Teil der Rede markiert sind, möchte ich diejenigen finden, die Obszönitäten im Mainstream-Englisch sind. Wie könnte ich das machen? Sollte ich einfach eine riesige Liste erstellen und prüfen, ob in der Liste etwas enthalten ist? Sollte ich versuchen, eine Regex zu verwenden, um eine Reihe von Variationen einer einzelnen Wurzel zu erfassen?

Wenn es einfacher ist, möchte ich nicht herausfiltern, nur um eine Zählung zu erhalten. Wenn es also einige Fehlalarme gibt, ist es nicht das Ende der Welt, solange die Rate mehr oder weniger gleichmäßig überhöht ist.

Antworten auf die Frage(11)

Ihre Antwort auf die Frage