¿Cómo limpiar microsoft html doc?
Tengo un documento bastante grande en formato html que se genera desde Microsoft Word. Es tan desordenado y lleno de cosas hinchadas (como etiquetas desconocidas, espacios de nombres no conocidos, etc. y otras cosas hinchadas)
¿Hay alguna manera de convertirlo en sintaxis html simple?