Python obtiene todos los enlaces de una página de resultados de búsqueda de Google

Question

Aug 24, 2014, 01:56 PM

Python obtiene todos los enlaces de una página de resultados de búsqueda de Google

Quiero crear un script que devuelva todas las URL encontradas en una página de Google, por ejemplo, así que creo este script: (usando BeautifulSoup)

import urllib2
from BeautifulSoup import BeautifulSoup
page = urllib2.urlopen("https://www.google.dz/search?q=see")
soup = BeautifulSoup(page.read())
links = soup.findAll("a")
for link in links:
    print link["href"]

y devuelve este resultado prohibido 403:

Traceback (most recent call last):
  File "C:\Python27\sql\sql.py", line 3, in <module>
    page = urllib2.urlopen("https://www.google.dz/search?q=see")
  File "C:\Python27\lib\urllib2.py", line 126, in urlopen
    return _opener.open(url, data, timeout)
  File "C:\Python27\lib\urllib2.py", line 400, in open
    response = meth(req, response)
  File "C:\Python27\lib\urllib2.py", line 513, in http_response
    'http', request, response, code, msg, hdrs)
  File "C:\Python27\lib\urllib2.py", line 438, in error
    return self._call_chain(*args)
  File "C:\Python27\lib\urllib2.py", line 372, in _call_chain
    result = func(*args)
  File "C:\Python27\lib\urllib2.py", line 521, in http_error_default
    raise HTTPError(req.get_full_url(), code, msg, hdrs, fp)
urllib2.HTTPError: HTTP Error 403: Forbidden

¿Alguna idea para evitar este error u otro método para obtener las URL del resultado de búsqueda?

Respuestas a la pregunta(2)

Preguntas populares

0 la respuesta

Probando una aplicación WPF con pruebas CodedUI, ¿debería el proyecto de prueba de interfaz de usuario codificado compartir una solución o no?

0 la respuesta

cómo detectar la conexión de ese usuario se pierde o cerró la ventana del navegador en Nodejs socket.io

0 la respuesta

¿Cómo detectar la conectividad VPN del iPhone?

0 la respuesta

para encontrar ubicaciones en el mapa de Google dentro de un radio de 5 km de un punto dado

0 la respuesta

MySQL Cluster (NDB) vs MySQL Replication (InnoDB) para aplicaciones Rails 3: pros / contras

¡Eres muy activo! ¡Es genial!

Python obtiene todos los enlaces de una página de resultados de búsqueda de Google

Respuestas a la pregunta(2)

Su respuesta a la pregunta

Preguntas populares