Как очистить Microsoft HTML HTML?
У меня есть довольно большой документ в формате HTML, созданный из Microsoft Word. Это так грязно и полно раздутых вещей (таких как неизвестные теги, неизвестные пространства имен и т. Д. И другие раздутые вещи)
Есть ли способ преобразовать его в обычный HTML-синтаксис?