Processamento de Linguagem Natural: Encontre obscenidades em inglês?

Dado um conjunto de palavras marcadas para parte do discurso, quero encontrar aquelas que são obscenidades no inglês tradicional. Como eu posso fazer isso? Devo apenas fazer uma lista enorme e verificar a presença de qualquer coisa na lista? Devo tentar usar um regex para capturar um monte de variações em uma única raiz?

Se isso facilitar, não quero filtrar, apenas para obter uma contagem. Então, se há alguns falsos positivos, não é o fim do mundo, desde que exista uma taxa mais ou menos uniformemente exagerada.

questionAnswers(11)

yourAnswerToTheQuestion