Como remover uma porcaria de marcação do Word ao inserir em um formulário?

Estou criando um CMS em PHP e um receio que tenho é que os usuários terão que preencher os dados dos documentos existentes do Word (e Excel, mas não importa). Agora, vi o que acontece quando eles copiam e colam descuidadamente do Word para uma área de texto: o banco de dados foi preenchido com marcação de porcaria.

Agora, eu certamente poderia retirar toda a marcação, mas teria que começar a aprender sobre isso primeiro. Então, pergunto: você já testou algumas funcionalidades - plugins dos suspeitos do costume (tinyMCE, FCKeditor, etc) que ajudam aqui? Bônus pela solução menos intrusiva.

questionAnswers(4)

yourAnswerToTheQuestion