Procesamiento del lenguaje natural: ¿Encontrar obscenidades en inglés?

Dado un conjunto de palabras etiquetadas para una parte del discurso, quiero encontrar aquellas que son obscenidades en el inglés convencional. ¿Cómo podría hacer esto? ¿Debo hacer una lista enorme y verificar si hay algo en la lista? ¿Debo intentar usar una expresión regular para capturar un montón de variaciones en una sola raíz?

Si lo hace más fácil, no quiero filtrarme, solo para obtener un conteo. Entonces, si hay algunos falsos positivos, no es el fin del mundo, siempre y cuando exista una tasa más o menos uniformemente superior a la exagerada.

Respuestas a la pregunta(11)

Su respuesta a la pregunta