Resultados de la búsqueda a petición "web-scraping"

3 la respuesta

seleccionando segundo hijo en sopa hermosa

Digamos que tengo: <div> <p>this is some text</p> <p>...and this is some other text</p> </div>¿Cómo puedo recuperar el texto del segundo párrafo en beautifulsoup?

2 la respuesta

Para superar el límite de ImportXML en la hoja de cálculo de Google

Me estoy metiendo en un "problema de raspado" en este momento. Especialmente quiero extraer el nombre del autor de una página web a la hoja de cálculo de Google. En realidad la función=IMPORTXML(A2,"//span[@class='author vcard meta-item']") está ...

1 la respuesta

¿Cómo hacer un scripts de selenio más rápido?

Uso python Selenium y Scrapy para rastrear un sitio web. pero mi guión es muy lento Crawled 1 pages (at 1 pages/min)Yo uso CSS SELECTOR en lugar de XPATH para optimizar el tiempo. cambio los ...

1 la respuesta

Paquete de agilidad HTML: encontrar nodo de comentario

Estoy raspando un sitio web que usa Javascript para poblar dinámicamente el contenido de un sitio web con el paquete Html Agility. Básicamente, estaba buscando el XPATH"\\div[@class='PricingInfo']", pero ese nodo div se estaba escribiendo en el ...

1 la respuesta

Usar r para navegar y raspar una página web con formularios html desplegables

Estoy tratando de raspar datos de http://www.footballoutsiders.com/stats/snapcounts [http://www.footballoutsiders.com/stats/snapcounts], pero no puedo cambiar los campos en los cuadros desplegables del sitio ("equipo", "semana", "posición" ...

1 la respuesta

Renombrar archivos descargados de selenio

Estoy usando selenium para descargar automáticamente archivos en formato csv desde esta página: https://catalog.data.gov/dataset?tags=crime [https://catalog.data.gov/dataset?tags=crime] Este es el código que estoy usando: profile = ...

1 la respuesta

La función iterativa de raspar rasgar da: "Error en open.connection (x," rb "): se ha alcanzado el tiempo de espera

Estoy raspandoeste sitio web [http://karakterstatistik.stads.ku.dk/]utilizando el paquete "rvest". Cuando itero mi función demasiadas veces me sale "Error en open.connection (x," rb "): Se alcanzó el tiempo de espera". He buscado preguntas ...

1 la respuesta

¿Cómo escribo todas estas filas en un archivo CSV para un rango determinado?

El propósito del código a continuación es el webscrape, el diccionario de inglés de Oxford para palabras que fueron "inventadas" en cada año dentro de un rango de años. Todo esto funciona según lo previsto. import csv import os import re import ...

1 la respuesta

Raspado de tablas en varias páginas web con rvest en R

Soy nuevo en el raspado web y estoy tratando de raspar tablas en varias páginas web. Aquí está el sitio:http://www.baseball-reference.com/teams/MIL/2016.shtml [http://www.baseball-reference.com/teams/MIL/2016.shtml] Puedo raspar una tabla en una ...

2 la respuesta

Excel VBA e IE 11: no se puede actualizar la página después de seleccionar el valor en un menú desplegable

Estoy tratando de obtener el tipo de cambio de moneda ofrecido por WorldRemit para un par de monedas. Quiero cambiar el valor en la lista desplegable 'Enviar desde' en la esquina superior izquierda de la página web. ...