разобрать фрагмент тела html в lxml
Я пытаюсь разобрать фрагмент HTML:
title<img src="">
я используюlxml.html.fromstring
, И это сводит меня с ума, потому что он продолжает раздеваться тег моих фрагментов: я
> lxml.html.fromstring('a').tag
'html'
> lxml.html.fromstring('a').tag
'div'
> lxml.html.fromstring('a').tag
'h1'
мы также пробовали,document_fromstring
fragment_fromstring
clean_html
сpage_structure=False
и т.д ... ничего не работает.
Мне нужно использовать lxml, так как ям, передав HTML-фрагмент в PyQuery.
Я просто хочу, чтобы lxml не связывался с моим HTML-фрагментом. Возможно ли это сделать?