Resultados de la búsqueda a petición "beautifulsoup"

from BeautifulSoup import BeautifulStoneSoup xml_data = """ <doc> <test>test</test> <foo:bar>Hello world!</foo:bar> </doc> """ soup = BeautifulStoneSoup(xml_data) print soup.prettify() make = soup.find('foo:bar') print make # prints ...

python utf-8 unicode

5 la respuesta

Problemas de codificación de Python y BeautifulSoup

Estoy escribiendo un rastreador con Python usando BeautifulSoup, y todo iba bien hasta que me encontré con este sitio: http: //www.elnorte.ec [http://www.elnorte.ec/] Recibo los contenidos con la biblioteca de solicitudes: r = ...

html-parsing python lxml

1 la respuesta

eliminar ciertos atributos de las etiquetas HTML

¿Cómo puedo eliminar ciertos atributos como id, estilo, clase, etc. del código HTML? Pensé que podría usar el lxml.html.clean module [http://lxml.de/lxmlhtml.html#cleaning-up-html], pero resultó que solo puedo eliminar atributos de estilo ...

xml python

2 la respuesta

Parcar XML no estándar (etiqueta CDATA)

Cuando quiero analizar un documento XML en Python usando la biblioteca BeautifulSoup, me enfrenté a algunos problemas. El documento XML que quiero analizar: <item> <title><![CDATA[Title Sample]]></title> ...

python urllib2 urllib

1 la respuesta

¿Cómo descargar texto e imágenes desde URL con Python / urllib / beautifulsoup?

He estado navegando por varias publicaciones aquí, pero no puedo entender cómo descargar imágenes y texto por lotes desde una URL determinada con Python. import urllib,urllib2 import urlparse from BeautifulSoup import BeautifulSoup import os, ...

python

2 la respuesta

Clean URL con BeautifulSoup

Mi script import BeautifulSoup as bs from BeautifulSoup import BeautifulSoup url_list = sys.argv[1] urls = [tag['href'] for tag ...

html innerhtml python

5 la respuesta

BeautifulSoup innerhtml?

Digamos que tengo una página con unadiv. Puedo obtener fácilmente ese div consoup.find(). Ahora que tengo el resultado, me gustaría imprimir TODOinnerhtml de esodiv: Quiero decir, necesitaría una cadena con TODAS las etiquetas html y el ...

rss python

1 la respuesta

Prese todos los elementos del elemento con elementos secundarios de RSS con beautifulsoup

esde un feed RSS, ¿cómo se obtiene una cadena de todo lo que está dentro de cada articul etiqueta? Ejemplo de entrada (simplificado): <?xml version="1.0" encoding="UTF-8"?> <rss version="2.0"> <channel> <title>Test</title> <item> <title>Hello ...

xml python web-applications screen-scraping

2 la respuesta

¿Cómo representar el contenido de una etiqueta en unicode en BeautifulSoup?

Esta es una sopa de una página de detalles de publicaciones de WordPress: content = soup.body.find('div', id=re.compile('post')) title = content.h2.extract() item['title'] = unicode(title.string) item['content'] = u''.join(map(unicode, ...

python

2 la respuesta

Diferencia entre attrMap y attrs en beautifulSoup

Me gustaría saber cuál es la diferencia entreattrMap yattrs in BeautifulSoup [http://www.crummy.com/software/BeautifulSoup/]? Para ser más específicos, qué etiquetas tienenattrs y que tienenattrMap? >>> soup = ...

Página 27 de 28

24 25 262728

Resultados de la búsqueda a petición "beautifulsoup"

Cambiar el valor del elemento con BeautifulSoup devuelve el elemento vacío

Problemas de codificación de Python y BeautifulSoup

eliminar ciertos atributos de las etiquetas HTML

Etiquetas Populares

Parcar XML no estándar (etiqueta CDATA)

¿Cómo descargar texto e imágenes desde URL con Python / urllib / beautifulsoup?

Clean URL con BeautifulSoup

BeautifulSoup innerhtml?

Prese todos los elementos del elemento con elementos secundarios de RSS con beautifulsoup

¿Cómo representar el contenido de una etiqueta en unicode en BeautifulSoup?

Diferencia entre attrMap y attrs en beautifulSoup

¡Eres muy activo! ¡Es genial!

Resultados de la búsqueda a petición "beautifulsoup"

Etiquetas Populares