Resultados da pesquisa a pedido "lxml"

3 a resposta

Remova todas as tags javascript e de estilo do html com python e o módulo lxml

Estudo analisando um documento html usando ohttp: //lxml.de [http://lxml.de/] library. Até agora, descobri como retirar as tags de um documento html No lxml, como faço para remover uma tag, mas reter todo o ...

3 a resposta

XPath: selecione tag com valor vazio

Como posso encontrar no XPath 1.0 todas as linhas comcol name="POW"? <row> <col name="WOJ">02</col> <col name="POW"/> <col name="GMI"/> <col name="RODZ"/> <col name="NAZWA">DOLNOŚLĄSKIE</col> <col name="NAZDOD">województwo</col> <col ...

4 a resposta

Filtrando determinados bytes em python

Estou recebendo esse erro no meu programa python:ValueError: All strings must be XML compatible: Unicode or ASCII, no NULL bytes or control characters Essa questão, texto aleatório de / dev / random gerando um erro no lxml: todas as strings ...

2 a resposta

ocument @XML e XSL () Função

Oi, eu tenho os seguintes arquivos: merge.py: from lxml import etree xml_input = etree.XML(open('a.xml', 'r').read()) xslt_root = etree.XML(open('merge.xsl', 'r').read()) transform = etree.XSLT(xslt_root) print str(transform(xml_input)) ...

8 a resposta

Como devo lidar com um XMLSyntaxError no lxml do Python enquanto analisa um arquivo XML grand

Estou tentando analisar um arquivo XML com mais de 2 GB com a biblioteca lxml do Python. Infelizmente, o arquivo XML não tem uma linha informando a codificação de caracteres, então eu tenho que configurá-lo manualmente. Enquanto percorre o ...

4 a resposta

Como analisar HTML malformado em python

Preciso procurar na árvore DOM de um documento HTML analisad Estou usando uTidyLib antes de analisar a string com lxml a = tidy.parseString (código_html, opções) dom = etree.fromstring (str (a)) s vezes, recebo um erro, parece que o tidylib ...

8 a resposta

Como selecionar pai com base no filho em lxml?

Tenho este código: <table cellspacing="1" cellpadding="1" border="0"> <tbody> <tr> <td>Something else</td> </tr> <tr> <td valign="top"> <a href="http://exact url">Something</a> </td> <td valign="top">Something else</td> </tr> </tbody> ...

2 a resposta

lxml erro “IOError: erro ao ler o arquivo” ao analisar o facebook mobile em um script raspador python

Uso um script modificado deLogging no facebook com python [https://stackoverflow.com/questions/2030652/logging-into-facebook-with-python] post: #!/usr/bin/python2 -u # -*- coding: utf8 -*- facebook_email = "[email protected]" facebook_passwd ...

6 a resposta

Python sax para lxml para 80 + GB XML

Como você lê um arquivo XML usando sax e o converte em um elemento lxml etree.iterpars Para fornecer uma visão geral do problema, criei uma ferramenta de ingestão de XML usando lxml para um feed XML que varia no tamanho de 25 a 500 MB, que ...

4 a resposta

import lxml falha no OSX após (aparentemente) instalação bem-sucedida

Estou tentando instalar o lxml para python no OS X 10.6.8 Eu corrisudo env ARCHFLAGS="-arch i386 -arch x86_64" easy_install lxml no terminal com base nesta resposta a uma pergunta que instala o lxml:https: //stackoverflow.com/a/6545556/21633 ...