Resultados de la búsqueda a petición "web-scraping"

3 la respuesta

Jsoup Cookies para el raspado HTTPS

Estoy experimentando con este sitio para recopilar mi nombre de usuario en la página de bienvenida para aprender Jsoup y Android. Usando el siguiente código Connection.Response res ...

8 la respuesta

¿Cómo conectarse a través de HTTPS usando Jsoup?

Funciona bien a través de HTTP, pero cuando intento usar una fuente HTTPS arroja la siguiente excepción: 10-12 13:22:11.169: WARN/System.err(332): javax.net.ssl.SSLHandshakeException: java.security.cert.CertPathValidatorException: Trust anchor ...

2 la respuesta

¿Cómo raspo varias páginas con XML y ReadHTMLTable?

Estoy usando el paquete XML para raspar los resultados del maratón de Chicago en un CSV. El problema es que el sitio solo puede mostrar 1,000 corredores en una sola página, por lo que tengo que raspar varias páginas. El guión que he escrito ...

8 la respuesta

Selenium - Python - valor de la opción del menú desplegable

Necesito seleccionar un elemento de un menú desplegable. Por ejemplo, abra esto: <select id="fruits01" class="select" name="fruits"> <option value="0">Choose your fruits:</option> <option value="1">Banana</option> ...

2 la respuesta

Cómo raspar tablas HTML de una lista de enlaces

Estoy tratando de raspar algunas tablas (datos electorales) usando el paquete XML. Navegando SO, descubrí cómo raspar una sola URL usando: library(XML) url <- "http://www.elecciones2011.gob.ar/paginas/paginas/dat99/DPR99999A.htm" total ...

12 la respuesta

Página JavaScript de raspado web con Python

Estoy tratando de desarrollar un simple raspador web. Quiero extraer texto sin el código HTML. De hecho, logro este objetivo, pero he visto que en algunas páginas donde se carga JavaScript no obtuve buenos resultados. Por ejemplo, si algún ...

6 la respuesta

@Module solicita cómo recuperar correctamente los caracteres acentuados?

Estoy usando:Module: Request - Método de solicitud HTTP simplificado [https://github.com/mikeal/request] para raspar una página web con caracteres acentuadosá é ó ú ê ã etc. Ya he probadoencoding: utf-8 sin éxito. Todavía obtengo estos ...

6 la respuesta

Envíe datos a través del formulario web y extraiga los resultados

Mi nivel de Python es Novato. Nunca he escrito un raspador o rastreador web. He escrito un código de Python para conectarme a una API y extraer los datos que quiero. Pero para algunos de los datos extraídos, quiero obtener el género del autor. ...

10 la respuesta

php: Obtenga texto sin formato de html - simplehtmldom o php strip_tags?

Estoy buscando obtener el texto plano de html. ¿Cuál debo elegir, php strip_tags [http://php.net/manual/en/function.strip-tags.php] o simplehtmldom [http://simplehtmldom.sourceforge.net/] extracción de texto sin formato? One pro for ...

8 la respuesta

¿Cómo combino los resultados de la página de destino a la página actual en scrapy?

Necesita un ejemplo en scrapy sobre cómo obtener un enlace de una página, luego sigue este enlace, obtén más información de la página vinculada y vuelve a combinar con algunos datos de la primera página ... Gracia