Resultados de la búsqueda a petición "beautifulsoup"
Error de códec 'ascii' en beautifulsoup
Estoy usando beautifulsoup para extraer datos de la página html. Hasta ayer todo estuvo bien. Pero ahora recibo el error: 'ascii' codec can't encode character u'\xa9' in position 86700: ordinal not in range(128)estoy usando el código: import ...
BeautifulSoup no puede analizar el estado de la vista larga
Intento usar BeautifulSoup4 para analizar el html recuperado dehttp://exporter.nih.gov/ExPORTER_Catalog.aspx?index=0 Si imprimo la sopa resultante, termina así:
Problemas de codificación de Python y BeautifulSoup
Estoy escribiendo un rastreador con Python usando BeautifulSoup, y todo iba bien hasta que me encontré con este sitio: http: //www.elnorte.ec [http://www.elnorte.ec/] Recibo los contenidos con la biblioteca de solicitudes: r = ...
¿Te enfocas en resultados específicos mientras raspas Twitter con Python y Beautiful Soup 4?
Este es un seguimiento de mi publicación¿Usando Python para raspar divisiones y tramos anidados en Twitter? [https://stackoverflow.com/questions/34912889/using-python-to-scrape-nested-divs-and-spans-in-twitter] . No estoy usando la API de ...
Cómo obtener HTML de un hermoso objeto de sopa
Tengo la siguiente lista de objetos bs4: >>> listing <div class="listingHeader"> <h2> .... >>> type(listing) <class 'bs4.element.Tag'>Quiero extraer el html sin procesar como una cadena. He intentado: >>> a = listing.contents >>> type(a) <type ...
Python BeautifulSoup no raspa esta url
Estoy tratando de eliminar algunas filas de datos del jugador (tr) de una url, sin embargo, parece que no sucede nada cuando ejecuto mi código. Estoy seguro de que mi código está bien porque funciona con otros sitios web estadísticos ...
Cómo manejar IncompleteRead: en python
Estoy tratando de obtener algunos datos de un sitio web. Sin embargo me devuelve
BeautifulSoup se comporta de manera diferente en la máquina Amazon EC2
Estoy ejecutando el siguiente script: from bs4 import BeautifulSoup import urllib2 import sys print sys.version url = 'https://www.google.com/finance' page = urllib2.urlopen(url).read() soup = BeautifulSoup(page) trends_tag = soup.find('div', ...