Resultados da pesquisa a pedido "lxml"
Remova todas as tags javascript e de estilo do html com python e o módulo lxml
Estudo analisando um documento html usando ohttp: //lxml.de [http://lxml.de/] library. Até agora, descobri como retirar as tags de um documento html No lxml, como faço para remover uma tag, mas reter todo o ...
XPath: selecione tag com valor vazio
Como posso encontrar no XPath 1.0 todas as linhas comcol name="POW"? <row> <col name="WOJ">02</col> <col name="POW"/> <col name="GMI"/> <col name="RODZ"/> <col name="NAZWA">DOLNOŚLĄSKIE</col> <col name="NAZDOD">województwo</col> <col ...
Filtrando determinados bytes em python
Estou recebendo esse erro no meu programa python:ValueError: All strings must be XML compatible: Unicode or ASCII, no NULL bytes or control characters Essa questão, texto aleatório de / dev / random gerando um erro no lxml: todas as strings ...
ocument @XML e XSL () Função
Oi, eu tenho os seguintes arquivos: merge.py: from lxml import etree xml_input = etree.XML(open('a.xml', 'r').read()) xslt_root = etree.XML(open('merge.xsl', 'r').read()) transform = etree.XSLT(xslt_root) print str(transform(xml_input)) ...
Como devo lidar com um XMLSyntaxError no lxml do Python enquanto analisa um arquivo XML grand
Estou tentando analisar um arquivo XML com mais de 2 GB com a biblioteca lxml do Python. Infelizmente, o arquivo XML não tem uma linha informando a codificação de caracteres, então eu tenho que configurá-lo manualmente. Enquanto percorre o ...
Como analisar HTML malformado em python
Preciso procurar na árvore DOM de um documento HTML analisad Estou usando uTidyLib antes de analisar a string com lxml a = tidy.parseString (código_html, opções) dom = etree.fromstring (str (a)) s vezes, recebo um erro, parece que o tidylib ...
Como selecionar pai com base no filho em lxml?
Tenho este código: <table cellspacing="1" cellpadding="1" border="0"> <tbody> <tr> <td>Something else</td> </tr> <tr> <td valign="top"> <a href="http://exact url">Something</a> </td> <td valign="top">Something else</td> </tr> </tbody> ...
lxml erro “IOError: erro ao ler o arquivo” ao analisar o facebook mobile em um script raspador python
Uso um script modificado deLogging no facebook com python [https://stackoverflow.com/questions/2030652/logging-into-facebook-with-python] post: #!/usr/bin/python2 -u # -*- coding: utf8 -*- facebook_email = "[email protected]" facebook_passwd ...
Python sax para lxml para 80 + GB XML
Como você lê um arquivo XML usando sax e o converte em um elemento lxml etree.iterpars Para fornecer uma visão geral do problema, criei uma ferramenta de ingestão de XML usando lxml para um feed XML que varia no tamanho de 25 a 500 MB, que ...
import lxml falha no OSX após (aparentemente) instalação bem-sucedida
Estou tentando instalar o lxml para python no OS X 10.6.8 Eu corrisudo env ARCHFLAGS="-arch i386 -arch x86_64" easy_install lxml no terminal com base nesta resposta a uma pergunta que instala o lxml:https: //stackoverflow.com/a/6545556/21633 ...