Resultados de la búsqueda a petición "lxml"

1 la respuesta

¿Forma rápida y efectiva de analizar HTML roto?

Estoy trabajando en proyectos grandes que requieren un análisis rápido de HTML, incluida la recuperación de páginas HTML rotas. Actualmente, lxml es mi elección, sé que también proporciona una interfaz para el modo de recuperación de libxml2, ...

2 la respuesta

XPathEvalError: función no registrada para coincidencias () en lxml

Estoy tratando de usar la siguiente consulta xpath en python from lxml.html.soupparser import fromstring root = fromstring(inString) nodes = root.xpath(".//p3[matches(.,'ABC')]//preceding::p2//p3")pero me da el error nodes = ...

1 la respuesta

¿Cómo instalar lxml para PyPy?

He creado un virtualenv para PyPy con: virtualenv test -p `which pypy` source test/bin/activateInstalé las siguientes dependencias: sudo apt-get install python-dev libxml2 libxml2-dev libxslt-devY luego corro: pip install --upgrade pypyComo ...

1 la respuesta

Cómo eliminar todos los atributos del elemento

Cómo eliminar todos los atributos de los elementos específicos en todo el documento. Estoy intentando algo como esto: from bs4 import UnicodeDammit from lxml import html content = open("source.html").read() document = UnicodeDammit(content, ...

2 la respuesta

No se puede instalar lxml en Windows, error fatal C1083: No se puede abrir el archivo de inclusión: 'libxml / xmlversion.h'

Python noob, por favor tengan paciencia conmigo. Usé el instalador de Python para v3.5.1 de www.python.org. Mi intención era usar Scrapy para ejecutar algunos scripts. pip install scrapy falló, al igual que easy_install scrapy y otros. Rastreé ...

1 la respuesta

SyntaxError de caracteres no ASCII [duplicado]

Esta pregunta ya tiene una respuesta aquí: Forma correcta de definir la codificación del código fuente de Python [/questions/728891/correct-way-to-define-python-source-code-encoding] 6 respuestasSyntaxError: carácter no ASCII '\ xa3' en el ...

2 la respuesta

encontrando elementos por atributo con lxml

Necesito analizar un archivo xml para extraer algunos datos. Solo necesito algunos elementos con ciertos atributos, aquí hay un ejemplo de documento: <root> <articles> <article type="news"> <content>some text</content> </article> <article ...

1 la respuesta

Preservar el orden de los atributos XML?

Sé que esta pregunta se ha hecho en el pasado, pero todas se han fechado hace unos años. Me pregunto si se han realizado cambios en los módulos de Python como lxml, minidom o etree que nos permitirán preservar el orden de los atributos en los ...

26 la respuesta

libxml error de instalación usando pip

Este es mi error: (mysite)zjm1126@zjm1126-G41MT-S2:~/zjm_test/mysite$ pip install lxml Downloading/unpacking lxml Running setup.py egg_info for package lxml Building lxml version 2.3. Building without Cython. ERROR: /bin/sh: xslt-config: ...

2 la respuesta

Python lxml XPath problem

Estoy intentando imprimir / guardar el HTML de un determinado elemento desde una página web. He recuperado el XPath del elemento solicitado de firebug. Todo lo que deseo es guardar este elemento en un archivo. Parece que no ...