Подберите любой символ (включая символы новой строки) в sed

У меня есть команда sed, которую я хочу запустить на огромном, ужасном, уродливом HTML-файле, который был создан из документа Microsoft Word. Все, что он должен сделать, это удалить любой экземпляр строки

style='text-align:center; color:blue;
exampleStyle:exampleValue'

Команда sed, которую я пытаюсь изменить,

sed "s/ style='[^']*'//" fileA > fileB

Он прекрасно работает, за исключением того, что всякий раз, когда внутри соответствующего текста появляется новая строка, он не совпадает. Есть ли модификатор для sed или что-то, что я могу сделать, чтобы вызвать сопоставление любого символа, включая переводы строки?

Я понимаю, что регулярные выражения ужасны в XML и HTML, бла-бла-бла, но в этом случае строковые шаблоны хорошо сформированы в том смысле, что атрибуты стиля всегда начинаются с одной кавычки и заканчиваются одной кавычкой. Так что, если бы я мог просто решить проблему перехода на новую строку, я мог бы сократить размер HTML более чем на 50% с помощью одной этой команды.

В конце концов выяснилось, что Perl-скрипт Sinan's n # xFC; r работает лучше всего. Это было почти мгновенно, и это уменьшило размер файла с 2,3 МБ до 850 КБ. Добрый день! Perl ...

Ответы на вопрос(5)

Ваш ответ на вопрос