Resultados de la búsqueda a petición "lxml"
Python alexa resultado analizando con lxml.etree
Estoy usando alexa api de aws pero me resulta difícil analizar el resultado para obtener lo que quiero alexa api devuelve un árbol de objetos<type 'lxml.etree._ElementTree'> Yo uso este código para imprimir el árbol from lxml import etree root ...
Referencias de entidades y lxml
Aquí está el código que tengo: from cStringIO import StringIO from lxml import etree xml = StringIO('''<?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE root [ <!ENTITY test "This is a test"> ]> <root> <sub>&test;</sub> </root>''') d1 = ...
¿Cómo abrir este archivo XML para crear un marco de datos en Python?
¿Alguien tiene una sugerencia sobre la mejor manera de abrir los datos xml en el sitio a continuación para ponerlos en un marco de datos (prefiero trabajar con pandas) en Python? El archivo está en el enlace "Datos - XML (sdmx / zip)" en este ...
¿Cómo hago coincidir el contenido de un elemento en XPath (lxml)?
Quiero analizar HTML con lxml usando expresiones XPath. Mi problema coincide con el contenido de una etiqueta: Por ejemplo dado el <a href="http://something">Example</a>elemento puedo hacer coincidir el atributo href ...
¿Cómo encontrar recursivamente una etiqueta de XML usando LXML?
<?xml version="1.0" ?> <data> <test > <f1 /> </test > <test2 > <test3> <f1 /> </test3> </test2> <f1 /> </data>Usando lxml, ¿es posible encontrar recursivamente la etiqueta "f1"? Intenté el método Findall pero funciona solo para niños ...
error de pip: opción de línea de comando no reconocida "-fstack-protector-strong"
Cuando yosudo pip install pyquery, sudo pip install lxmlysudo pip install cython, Obtengo una salida muy similar con el mismo error que dice: x86_64-linux-gnu-gcc: error: unrecognized command line option ‘-fstack-protector-strong’ Aquí está la ...
Cómo encontrar hijos directos de element en lxml
Encontré un objeto con clase específica: THREAD = TREE.find_class('thread')[0]Ahora quiero obtener todo<p> elementos que son sus hijos directos. Estoy cansado: THREAD.findall("p") THREAD.xpath("//div[@class='thread']/p")Pero todo eso devuelve ...
Python: uso de xpath localmente / en un elemento específico
Estoy tratando de obtener los enlaces de una página con xpath. El problema es que solo quiero los enlaces dentro de una tabla, pero si aplico la expresión xpath en toda la página, capturaré los enlaces que no quiero. Por ejemplo: tree = ...
¿Cómo usar la expresión regular en lxml xpath?
Estoy usando una construcción como esta: doc = parse(url).getroot() links = doc.xpath("//a[text()='some text']")Pero necesito seleccionar todos los enlaces que tienen texto que comienza con "algún texto", así que me pregunto si hay alguna forma ...
Múltiples espacios de nombres XML en la etiqueta con LXML
Estoy tratando de usar la biblioteca Pythons LXML para crear un archivo GPX que pueda leer el producto Mapsource de Garmin. El encabezado en sus archivos GPX se ve así <?xml version="1.0" encoding="UTF-8" standalone="no" ?> ...