¿Cómo elimino la basura de marcado de Word cuando la inserto en un formulario?

Estoy construyendo un CMS en PHP y un temor que tengo es que los usuarios tendrán que completar los datos de los documentos existentes de Word (y Excel, pero no importa). Ahora, he visto lo que sucede cuando descuidadamente copian y pegan de Word en un área de texto: la base de datos se llenó de marcas de basura.

Ahora, ciertamente podría eliminar todo el marcado yo mismo, pero primero tendría que comenzar a aprender sobre eso. Entonces le pregunto: ¿ha probado alguna funcionalidad: complementos de los sospechosos habituales (tinyMCE, FCKeditor, etc.) que ayudan aquí? Bonificación por la solución menos intrusiva.

Respuestas a la pregunta(4)

Su respuesta a la pregunta