Resultados de la búsqueda a petición "beautifulsoup"

2 la respuesta

Error de códec 'ascii' en beautifulsoup

Estoy usando beautifulsoup para extraer datos de la página html. Hasta ayer todo estuvo bien. Pero ahora recibo el error: 'ascii' codec can't encode character u'\xa9' in position 86700: ordinal not in range(128)estoy usando el código: import ...

3 la respuesta

BeautifulSoup en Python: obtener la etiqueta n-th de un tipo

1 la respuesta

BeautifulSoup no puede analizar el estado de la vista larga

Intento usar BeautifulSoup4 para analizar el html recuperado dehttp://exporter.nih.gov/ExPORTER_Catalog.aspx?index=0 Si imprimo la sopa resultante, termina así:

3 la respuesta

Buscar y reemplazar en HTML con BeautifulSoup

5 la respuesta

Problemas de codificación de Python y BeautifulSoup

Estoy escribiendo un rastreador con Python usando BeautifulSoup, y todo iba bien hasta que me encontré con este sitio: http: //www.elnorte.ec [http://www.elnorte.ec/] Recibo los contenidos con la biblioteca de solicitudes: r = ...

2 la respuesta

¿Te enfocas en resultados específicos mientras raspas Twitter con Python y Beautiful Soup 4?

Este es un seguimiento de mi publicación¿Usando Python para raspar divisiones y tramos anidados en Twitter? [https://stackoverflow.com/questions/34912889/using-python-to-scrape-nested-divs-and-spans-in-twitter] . No estoy usando la API de ...

1 la respuesta

Cómo obtener HTML de un hermoso objeto de sopa

Tengo la siguiente lista de objetos bs4: >>> listing <div class="listingHeader"> <h2> .... >>> type(listing) <class 'bs4.element.Tag'>Quiero extraer el html sin procesar como una cadena. He intentado: >>> a = listing.contents >>> type(a) <type ...

3 la respuesta

Python BeautifulSoup no raspa esta url

Estoy tratando de eliminar algunas filas de datos del jugador (tr) de una url, sin embargo, parece que no sucede nada cuando ejecuto mi código. Estoy seguro de que mi código está bien porque funciona con otros sitios web estadísticos ...

7 la respuesta

Cómo manejar IncompleteRead: en python

Estoy tratando de obtener algunos datos de un sitio web. Sin embargo me devuelve

1 la respuesta

BeautifulSoup se comporta de manera diferente en la máquina Amazon EC2

Estoy ejecutando el siguiente script: from bs4 import BeautifulSoup import urllib2 import sys print sys.version url = 'https://www.google.com/finance' page = urllib2.urlopen(url).read() soup = BeautifulSoup(page) trends_tag = soup.find('div', ...