Resultados da pesquisa a pedido "web-scraping"

29 a resposta

Opções para raspagem de HTML? [fechadas]

Estou pensando em tentarSopa bonita [http://en.wikipedia.org/wiki/Beautiful_Soup], um pacote Python para raspagem de HTML. Existem outros pacotes de raspagem de HTML que eu deveria estar olhando? Python não é um requisito, estou realmente ...

2 a resposta

Para exceder o limite ImportXML na planilha do Google

Estou preso em um "problema de raspagem" agora. Especialmente, quero extrair o nome do autor de uma página da web para a planilha do Google. Realmente a função=IMPORTXML(A2,"//span[@class='author vcard meta-item']") está funcionando, mas depois ...

2 a resposta

NoClassDefFoundError: org / apache / http / HttpEntity no Selenium para ChromeDriver?

estou tentando buscar dados de um site usando a automação Selenium quando estou tentando acessar dados desse site, estou recebendo a seguinte exceção run: Starting ChromeDriver (v2.9.248315) on port 15621 Exception in thread "main" ...

1 a resposta

Como reagendar 403 códigos de status HTTP para serem rastreados posteriormente no scrapy?

Conformeestes [http://doc.scrapy.org/en/latest/topics/downloader-middleware.html#module-scrapy.downloadermiddlewares.retry] instruções Posso ver que os erros HTTP 500, os erros de conexão perdidos etc. são sempre reagendados, mas não consigo ...

1 a resposta

Rastreador da Web para extrair dos elementos da lista

Estou tentando extrair de<li> marca as datas e as armazena em um arquivo do Excel. <li>January 13, 1991: At least 40 people <a href ="......."> </a> </li>Código: import urllib2 import os from datetime import datetime import ...

2 a resposta

Raspagem de dados de uma tabela com escasso

Recolher dados de uma tabela com escasso. A tabela html é como:

2 a resposta

Como raspar esta página da Web com Python e lxml? lista vazia retornada

Para fins educacionais, estou tentando rasparesta página [http://www.rottentomatoes.com/browse/dvd-top-rentals/]gradualmente comPython e lxml [http://docs.python-guide.org/en/latest/scenarios/scrape/], começando com nomes de filmes. Pelo que li ...

1 a resposta

O URL de solicitação XHR diz que não existe ao tentar analisar seu conteúdo

Antes de criar uma solução completa para o meu problema usando o Scrapy, estou postando uma versão simplista do que quero fazer: import requests url ...

2 a resposta

Beautiful Soup: acessando <li> elementos de <ul> sem identificação

Eu estou tentando raspar as pessoas que têm aniversários destePágina da WikipediaAqui está o código existente:

1 a resposta

Site de raspagem para dados de estoque com tags de atributo personalizadas

Estou tentando fazer uma macro para raspar informações sobre ações do investing.com com base no número ISIN do estoque. Até agora eu tenho isso: Sub Get_Stock_Data() Dim Page As New XMLHTTP60 Dim Doc As New HTMLDocument Dim inputbox As ...