Использование Python и lxml для удаления только тегов, которые имеют определенные атрибуты / значения
Я знаком с Этриstrip_tags
а такжеstrip_elements
методы, но я ищу простой способ удаления тегов (и оставляя их содержимое), которые содержат только определенные атрибуты / значения.
Например: я хотел бы раздеть всеspan
или жеdiv
теги (или другие элементы) из дерева (xhtm
л) которые имеютclass='myclass'
атрибут / значение (сохранение содержимого элемента, напримерstrip_tags
сделал бы). Между тем, те самые элементы, которыене иметьclass='myclass'
должен остаться нетронутым
Наоборот: я хотел бы, чтобы способ раздеть всех "голых"spans
или жеdivs
из дерева. Имеются в виду только теspans
/divs
(или любые другие элементы в этом отношении), которые имеют абсолютнонет атрибутов. Оставляя те же самые элементы, которыеиметь атрибуты (любые) нетронуты.
Я чувствую, что упускаю что-то очевидное, но довольно долго искал без удачи.