Обработка естественного языка: Находите матом на английском?

Учитывая набор слов, помеченных для части речи, я хочу найти те, которые являются матом в основном английском языке. Как я могу это сделать? Должен ли я просто сделать огромный список и проверить наличие чего-либо в списке? Должен ли я попытаться использовать регулярное выражение для захвата множества вариантов в одном корне?

Если это облегчает, я не хочу отфильтровывать, просто чтобы подсчитать. Так что, если есть некоторые ложные срабатывания, это не конец света, если есть более или менее равномерно завышенный показатель.

Ответы на вопрос(11)

Ваш ответ на вопрос