Resultados de la búsqueda a petición "web-scraping"

1 la respuesta

Intenté Python BeautifulSoup y Phantom JS: TODAVÍA no puede raspar sitios web

Es posible que haya visto mis frustraciones desesperadas en las últimas semanas aquí. He estado recogiendo algunos datos del tiempo de espera y todavía no puedo obtener datos de estos dos sitios http://www.centura.org/erwait ...

3 la respuesta

Eliminar 'u de una salida de webscrape

Hola, estoy usando Beautifulsoup para analizar un sitio web y obtener un nombre como salida. Pero después de ejecutar el script, obtengo un[u'word1', u'word2', u'word3'] salida. Lo que estoy buscando es'word1 word2 word3'. ¿Cómo deshacerse de ...

2 la respuesta

Raspado de sitio web javascript

Puedo eliminar datos de páginas html básicas, pero tengo problemas para eliminar el sitio a continuación. Parece que los datos se presentan a través de JavaScript, y no estoy seguro de cómo abordar ese problema. Preferiría usar R para raspar, si ...

1 la respuesta

Usando Mechanize (Python) para llenar el formulario

Quiero llenar el formulario en esta página usando Python Mechanize y luego registrar la respuesta. ¿Cómo debería hacerlo? Cuando busco formularios en esta página usando el siguiente código, muestra el formulario solo para la búsqueda. ¿Cómo debo ...

1 la respuesta

Web Scraping con VBA (cuando HTML <> DOM)

Me lo he pasado muy mal rascando los datos de esta página web en particular ... Básicamente puedo ver la información que necesito en el 'DOM Explorer' cuando cargo la URL en un navegador y presiono F12 manualmente, pero cuando ...

2 la respuesta

Scrapy CrawlSpider no sigue los enlaces en una página en particular

He creado una araña para rastrear un foro que requiere un inicio de sesión. Lo comienzo en la página de inicio de sesión. El problema ocurre con la página a la que dirijo la araña después de que el inicio de sesión fue exitoso. Si abro mis ...

0 la respuesta

¿Es este error un error de codificación? ¿Cómo lo resuelvo?

Estoy haciendo web scraping. A continuación se muestra el código que utilicé. Escribí algunos comentarios sobre el comentario. library(httr) library(rvest) library(stringr) # Bulletin board ...

2 la respuesta

¿No puede escribir correctamente los elementos extraídos en un archivo de Excel?

He escrito un código en Python para analizar el título y el enlace desde una página web. Inicialmente, intenté analizar los enlaces desde la barra lateral izquierda y luego raspar los documentos mencionados de cada página rastreando cada enlace. ...

1 la respuesta

Web scraping un sitio web con contenido dinámico de JavaScript

Así que estoy usando python y beautifulsoup4 (al que no estoy vinculado) para raspar un sitio web. El problema es que cuando uso urlib para tomar el html de una página, no es toda la página porque parte se genera a través de JavaScript. ¿Hay ...

2 la respuesta

El rastreador de clases escrito en python arroja un error de atributo

Después de escribir algo de código en Python, me quedé atrapado en serios problemas. Soy un novato en escribir código siguiendo el diseño OOP en python. Los xpaths que he usado en mi código son perfectos. Me estoy perdiendo cuando se trata de ...