PHP для очистки вставил ввод Microsoft

У меня есть сайт, где пользователи могут публиковать материалы (например, на форумах, в комментариях и т. Д.), Используя индивидуальную реализацию TinyMCE. Многим из них нравится копировать и вставлять из Word, что означает, что их ввод часто сопровождается множеством встроенного форматирования MS.

Я не могу просто избавиться от<span whatever> поскольку TinyMCE использует тег span для своего форматирования, и я не могу (и не хочу) заставлять указанных пользователей использовать функцию «Вставить из Word» в TinyMCE (которая в любом случае не очень хорошо работает) ,

Кто-нибудь знает библиотеку / класс / функцию, которая позаботится об этом для меня? Должно быть, это общая проблема, хотя я не могу найти ничего определенного. Недавно я подумал, что ряд регулярных выражений грубой силы, ищущих паттерны, специфичные для MS, могут сработать, но я не хочу переписывать то, что уже может быть доступно, если я не должен.

Кроме того, исправление фигурных кавычек, тире и т. Д. Было бы хорошо. У меня есть свои собственные вещи, чтобы сделать это сейчас, но я действительно хотел бы найти один фильтр MS-преобразования, чтобы управлять ими всеми.

Ответы на вопрос(2)

Ваш ответ на вопрос