Resultados da pesquisa a pedido "lxml"
lxml etree xmlparser remove o espaço para nome indesejado
Eu tenho um documento xml que estou tentando analisar usando Etree.lxml <Envelope xmlns="http://www.example.com/zzz/yyy"> <Header> <Version>1</Version> </Header> <Body> some stuff <Body> <Envelope>Meu código é: path = "path to xml file" from ...
Python: Usando xpath localmente / em um elemento específico
Estou tentando obter os links de uma página com xpath. O problema é que eu só quero os links dentro de uma tabela, mas se eu aplicar a expressão xpath em toda a página, capturarei os links que não quero. Por exemplo: tree = ...
Como encontrar filhos diretos do elemento no lxml
Encontrei um objeto com classe específica: THREAD = TREE.find_class('thread')[0]Agora eu quero pegar tudo<p> elementos que são seus filhos diretos. Eu cansei: THREAD.findall("p") THREAD.xpath("//div[@class='thread']/p")Mas todos esses retornos ...
No lxml, como faço para remover uma tag, mas reter todo o conteúdo?
O problema é este: eu tenho um fragmento XML como este: <fragment>text1 <a>inner1 </a>text2 <b>inner2</b> <c>t</c>ext3</fragment>Para o resultado, quero remover todos<a>- e<c>-Tags, mas mantém seus conteúdos (texto) e nós filhos exatamente como ...
Não é possível gravar os itens extraídos corretamente em um arquivo do Excel?
Eu escrevi algum código em python para analisar o título e o link de uma página da web. Inicialmente, tentei analisar os links da barra do lado esquerdo e depois raspar os documentos acima mencionados de cada página, rastreando cada link. Eu fiz ...
Quais são as diferenças entre lxml e ElementTree?
Quando se trata degerando dados XML em Python [https://stackoverflow.com/q/3844360/3357935], há duas bibliotecas que frequentemente vejo recomendadas:lxml ...
Python BeautifulSoup equivalente a lxml make_links_absolute
Portanto, o lxml possui um recurso muito útil: make_links_absolute: doc = lxml.html.fromstring(some_html_page) doc.make_links_absolute(url_for_some_html_page)e todos os links no documento são absolutos agora. Existe um equivalente fácil no ...
Gerando xml em python e lxml
Eu tenho esse xml do sql e quero fazer o mesmo pelo python 2.7 e lxml <?xml version="1.0" encoding="utf-16"?> <results> <Country name="Germany" Code="DE" Storage="Basic" Status="Fresh" Type="Photo" /> </results>Agora eu tenho: from lxml import ...
lxml.etree, element.text não retorna o texto inteiro de um elemento
Raspei alguns html via xpath, que depois converti em um etree. Algo semelhante a isso: <td> text1 <a> link </a> text2 </td>mas quando chamo element.text, recebo apenas text1 (deve estar lá, quando verifico minha consulta no FireBug, o texto ...
SSL: falha na verificação do certificado CERTIFICATE_VERIFY_FAILED
from lxml import html import requests url = "https://website.com/" page = requests.get(url) tree = html.fromstring(page.content) page.content->SSLError: falha na verificação do certificado [SSL: CERTIFICATE_VERIFY_FAILED] (_ssl.c: 748) Eu ...