Resultados de la búsqueda a petición "web-scraping"

1 la respuesta

Abrir página web, seleccionar todo, copiar en hoja

He buscado por todas partes algo que me funcione en esto, ¡no tuve suerte! ¡Cualquier ayuda será muy apreciada! :) Buscando copiar datos de opciones sobre acciones de Barcharts.com y pegarlos en la hoja de Excel. aquí es donde estoy: Sub ...

1 la respuesta

BeautifulSoup se comporta de manera diferente en la máquina Amazon EC2

Estoy ejecutando el siguiente script: from bs4 import BeautifulSoup import urllib2 import sys print sys.version url = 'https://www.google.com/finance' page = urllib2.urlopen(url).read() soup = BeautifulSoup(page) trends_tag = soup.find('div', ...

1 la respuesta

Uso de solicitudes y BeautifulSoup: Python devuelve una etiqueta sin texto

Estoy tratando de capturar el número de visitas en esta página, pero Python devuelve la etiqueta sin texto. Esto es lo que he hecho. import requests from bs4 import BeautifulSoup r ...

3 la respuesta

Ejecutar docenas de arañas Scrapy de manera controlada

Estoy tratando de construir un sistema para ejecutarunas pocas docenas de arañas Scrapy [https://github.com/alltheplaces/alltheplaces/tree/master/locations/spiders], guarde los resultados en S3 y avíseme cuando finalice. Hay varias ...

3 la respuesta

Uso de solicitudes de Python con páginas de JavaScript

Estoy tratando de usar el marco de solicitudes con python ( http://docs.python-requests.org/en/latest/ [http://docs.python-requests.org/en/latest/]) pero la página a la que intento acceder utiliza JavaScript para obtener la información que ...

1 la respuesta

Phantomjs page.content no está recuperando el contenido de la página

Uso Phantomjs para raspar sitios web que usan JavaScript y Ajax para cargar contenido dinámico. Tengo el siguiente código: var page = require('webpage').create(); page.onError = function(msg, trace) { var msgStack = ['ERROR: ' + msg]; if (trace ...

2 la respuesta

Capture la respuesta AJAX con selenio y python

Hago clic en un enlace en Firefox, la página web envía una solicitud usando JavaScript, luego el servidor envía algún tipo de respuesta que incluye una dirección de sitio web. Entonces, este nuevo sitio web se abre en una nueva ventana. El código ...

1 la respuesta

Raspe varias páginas con BeautifulSoup y Python

Mi código raspa con éxito las etiquetas tr align = center de [ http://my.gwu.edu/mod/pws/courses.cfm?campId=1&termId=201501&subjId=ACCY [http://my.gwu.edu/mod/pws/courses.cfm?campId=1&termId=201501&subjId=ACCY]] y escribe los elementos td en un ...

0 la respuesta

Diferentes resultados al usar Selenium + Python

Estoy aprendiendo cómo usar Selenium con Python tratando de desechar el software Matrix ITA (en caso de que no lo sepa, ayuda a encontrar buenas tarifas de vuelo). Estoy completando todo el formulario con Selenium exactamente de la misma manera ...

1 la respuesta

Iniciar Scrapy desde una vista de Django

Mi experiencia con Scrapy es limitada, y cada vez que la uso, siempre es a través de los comandos del terminal. ¿Cómo puedo obtener mis datos de formulario (una URL para ser eliminada) de mi plantilla de django para comunicarme con scrapy para ...