Resultados de la búsqueda a petición "lxml"

3 la respuesta

Obtención de información de posición al analizar HTML en Python

Estoy tratando de encontrar una manera de analizar HTML (potencialmente malformado) en Python y, si se cumple un conjunto de condiciones, generar esa parte del documento con la posición (línea, columna). La información de posición es lo que me ...

1 la respuesta

Raspando un nuevo sitio ESPN usando xpath [Python]

Estoy tratando de raspar el nuevo marcador de ESPN NBA. Aquí hay una secuencia de comandos simple que debería devolver los tiempos de inicio de todos los juegos el 4/4/15: import requests import lxml.html from lxml.cssselect import CSSSelector ...

4 la respuesta

Instalación de lxml, libxml2, libxslt en Windows 8.1

Después de una exploración adicional, encontré una solución para instalar lxml con pip y wheel. Comentarios adicionales sobre el enfoque son bienvenidos.Me parece excelente la documentación existente de Python para distribuciones de Linux. Para ...

1 la respuesta

Ejecutando Scrapy en PyPy

¿Es posible correrScrapy enPyPy? He revisado la documentación y el proyecto github, pero el único lugar dondePyPy se menciona que se ejecutaron algunas pruebas unitarias enPyPy Hace 2 años, verPyPy ...

1 la respuesta

analizar xml que contiene el espacio de nombres predeterminado para obtener un valor de elemento usando lxml

Tengo una cadena xml como esta str1 = """<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <sitemap> <loc> http://www.example.org/sitemap_1.xml.gz </loc> <lastmod>2015-07-01</lastmod> </sitemap> </sitemapindex> """Quiero extraer ...

1 la respuesta

lxml.etree._Element.append () de un bucle que no funciona como se esperaba

Me gustaría saber por qué en este códigoappend() parece funcionar desde el interior del bucle, pero el xml resultante muestra la modificación solo desde la última iteración, mientras queremove() Funciona como se esperaba. Este es un ejemplo ...

2 la respuesta

Guardar XML usando ETree en Python. No está reteniendo espacios de nombres, y agregando ns0, ns1 y eliminando etiquetas xmlns

Veo que hay preguntas similares aquí, pero nada que me haya ayudado totalmente. También he mirado la documentación oficial sobre espacios de nombres pero no puedo encontrar nada que realmente me esté ayudando, quizás soy demasiado nuevo en el ...

2 la respuesta

Agregar atributos a elementos existentes, eliminar elementos, etc. con lxml

Analizo en el XML usando from lxml import etree tree = etree.parse('test.xml', etree.XMLParser())Ahora quiero trabajar en el XML analizado. Tengo problemas para eliminar elementos con espacios de nombres o solo elementos en general, ...

1 la respuesta

Cómo quitar datos de una página web en selenium webdriver

Quiero obtener el nombre de la empresa, el correo electrónico y el número de teléfono de esteEnlazar [http://ae.bizdirlib.com/node/946273]y poner estos contenidos en un archivo de Excel. Quiero hacer lo mismo para todas las páginas del sitio web. ...

2 la respuesta

¿Cómo raspar esta página web con Python y lxml? lista vacía devuelta

Con fines educativos, estoy tratando de rasparesta página [http://www.rottentomatoes.com/browse/dvd-top-rentals/]gradualmente conPython y lxml [http://docs.python-guide.org/en/latest/scenarios/scrape/], comenzando con los nombres de las ...