analisar fragmento de corpo html em lxml

Question

May 11, 2013, 05:35 PM

analisar fragmento de corpo html em lxml

Estou tentando analisar um fragmento de html:

<body><h1>title</h1><img src=""></body>

eu usolxml.html.fromstring. E isso está me deixando louco porque continua tirando a roupa<body> tag dos meus fragmentos:

 > lxml.html.fromstring('<html><h1>a</h1></html>').tag
 'html'
 > lxml.html.fromstring('<div><h1>a</h1></div>').tag
 'div'
 > lxml.html.fromstring('<body><h1>a</h1></body>').tag
 'h1'

Eu também tentei odocument_fromstring, fragment_fromstring, clean_html compage_structure=False, etc ... nada funciona.

Eu preciso usar lxml, já que estou passando o fragmento html para PyQuery.

Eu só quero lxml para não mexer com o meu fragmento de html. É possível fazer isso?

questionAnswers(1)

Perguntas populares

0 a resposta

Alterando a altura da linha do UIPickerView

0 a resposta

elhor maneira de fazer com que o plano de fundo do aplicativo se encaixe em dispositivos diferent

0 a resposta

BlackBerry touchEvent fora do campo dispara fieldChanged

0 a resposta

Erro "muita recursão" no JQuery 1.3.2

0 a resposta

ependência do @Maven para todo o arquivo org.springframework

Você é muito ativo! É ótimo!

analisar fragmento de corpo html em lxml

questionAnswers(1)

yourAnswerToTheQuestion

Perguntas populares