Resultados de la búsqueda a petición "lxml"
¿Forma rápida y efectiva de analizar HTML roto?
Estoy trabajando en proyectos grandes que requieren un análisis rápido de HTML, incluida la recuperación de páginas HTML rotas. Actualmente, lxml es mi elección, sé que también proporciona una interfaz para el modo de recuperación de libxml2, ...
XPathEvalError: función no registrada para coincidencias () en lxml
Estoy tratando de usar la siguiente consulta xpath en python from lxml.html.soupparser import fromstring root = fromstring(inString) nodes = root.xpath(".//p3[matches(.,'ABC')]//preceding::p2//p3")pero me da el error nodes = ...
¿Cómo instalar lxml para PyPy?
He creado un virtualenv para PyPy con: virtualenv test -p `which pypy` source test/bin/activateInstalé las siguientes dependencias: sudo apt-get install python-dev libxml2 libxml2-dev libxslt-devY luego corro: pip install --upgrade pypyComo ...
Cómo eliminar todos los atributos del elemento
Cómo eliminar todos los atributos de los elementos específicos en todo el documento. Estoy intentando algo como esto: from bs4 import UnicodeDammit from lxml import html content = open("source.html").read() document = UnicodeDammit(content, ...
No se puede instalar lxml en Windows, error fatal C1083: No se puede abrir el archivo de inclusión: 'libxml / xmlversion.h'
Python noob, por favor tengan paciencia conmigo. Usé el instalador de Python para v3.5.1 de www.python.org. Mi intención era usar Scrapy para ejecutar algunos scripts. pip install scrapy falló, al igual que easy_install scrapy y otros. Rastreé ...
SyntaxError de caracteres no ASCII [duplicado]
Esta pregunta ya tiene una respuesta aquí: Forma correcta de definir la codificación del código fuente de Python [/questions/728891/correct-way-to-define-python-source-code-encoding] 6 respuestasSyntaxError: carácter no ASCII '\ xa3' en el ...
encontrando elementos por atributo con lxml
Necesito analizar un archivo xml para extraer algunos datos. Solo necesito algunos elementos con ciertos atributos, aquí hay un ejemplo de documento: <root> <articles> <article type="news"> <content>some text</content> </article> <article ...
Preservar el orden de los atributos XML?
Sé que esta pregunta se ha hecho en el pasado, pero todas se han fechado hace unos años. Me pregunto si se han realizado cambios en los módulos de Python como lxml, minidom o etree que nos permitirán preservar el orden de los atributos en los ...
libxml error de instalación usando pip
Este es mi error: (mysite)zjm1126@zjm1126-G41MT-S2:~/zjm_test/mysite$ pip install lxml Downloading/unpacking lxml Running setup.py egg_info for package lxml Building lxml version 2.3. Building without Cython. ERROR: /bin/sh: xslt-config: ...
Python lxml XPath problem
Estoy intentando imprimir / guardar el HTML de un determinado elemento desde una página web. He recuperado el XPath del elemento solicitado de firebug. Todo lo que deseo es guardar este elemento en un archivo. Parece que no ...