Resultados de la búsqueda a petición "screen-scraping"
BeautifulSoup subpáginas de la lista con paginación "cargar más"
Muy nuevo aquí, así que disculpas de antemano. Estoy buscando obtener una lista de todas las descripciones de la compañía dehttps://angel.co/companies [https://angel.co/companies]para jugar. Las herramientas de análisis basadas en la web que he ...
Formulario programático Enviar
Quiero raspar el contenido de una página web. Los contenidos se producen después de que se haya completado y enviado un formulario en ese sitio. He leído cómo raspar el contenido / página web del resultado final, pero ¿cómo puedo enviar el ...
raspado pesado de iTunes Connect
Estoy buscando diferentes opciones para obtener los informes de ventas y otros datos del sitio web de iTunes Connect. Como Apple no proporciona una API, todas las soluciones que encontré se basan en raspar la página. Como necesito la información ...
Protección contra raspado de pantalla [cerrado]
Siguiendo con mi pregunta sobre elLegalidades del raspado de pantalla [https://stackoverflow.com/questions/396778/legalities-of-screen-scraping], incluso si es ilegal, las personas seguirán intentándolo, así que: ¿Qué mecanismos técnicos pueden ...
JSoup - Seleccionar todos los comentarios
Quiero seleccionar todos los comentarios de un documento usando JSoup. Me gustaría hacer algo como esto: for(Element e : doc.select("comment")) { System.out.println(e); }He intentado esto: for (Element e : doc.getAllElements()) { if (e ...
Raspado web de supermercados en Argentina
Estoy tratando de raspar datos del sitio web: https://www.disco.com.ar/Comprar/Home.aspx#_atCategory=false&_atGrilla=true&_id=21063 [https://www.disco.com.ar/Comprar/Home.aspx#_atCategory=false&_atGrilla=true&_id=21063] a través de una macro ...
Uso de Python y Mechanize para enviar datos de formulario y autenticar
Deseo enviar un inicio de sesión al sitio web Reddit.com, navegar a un área particular de la página y enviar un comentario. No veo qué hay de malo con este código, pero no funciona porque ningún cambio se refleja en el sitio de Reddit. import ...
Mecanizar para Python 3.x
¿Hay alguna forma de usar Mechanize con Python 3.x? ¿O hay algún sustituto que funcione en Python 3.x? He estado buscando durante horas, pero no encontré nada :( Estoy buscando la forma de iniciar sesión en el sitio con Python, pero el ...
BeautifulSoup: ¿Cómo extraigo todos los <li> s de una lista de <ul> s que contiene algunos <ul> s anidados?
Mi código fuente se ve así: <h3>Header3 (Start here)</h3> <ul> <li>List items</li> <li>Etc...</li> </ul> <h3>Header 3</h3> <ul> <li>List items</li> <ul> <li>Nested list items</li> <li>Nested list items</li></ul> <li>List items</li> </ul> ...