Resultados da pesquisa a pedido "web-scraping"

1 a resposta

No Excel VBA, como verificar se a página da Web está totalmente carregada?

Para pausar o código até que uma página da Web esteja totalmente carregada, eu tenho usado o método abaixo com grande sucesso quase o tempo todo. Do While objIE.Busy = True Or objIE.readyState <> 4: DoEvents: LoopMas, ocasionalmente, vejo o ...

2 a resposta

Rastreador de classe escrito em python gera erro de atributo

Depois de escrever algum código em python, fiquei com problemas profundos. Eu sou um novato ao escrever código seguindo o design do OOP em python. Os xpaths que usei no meu código são impecáveis. Estou me perdendo quando se trata de executar o ...

3 a resposta

Executando dezenas de aranhas Scrapy de maneira controlada

Estou tentando construir um sistema para rodaralgumas dúzias de aranhas Scrapy [https://github.com/alltheplaces/alltheplaces/tree/master/locations/spiders], salve os resultados no S3 e avise-o quando terminar. Existem várias perguntas semelhantes ...

2 a resposta

Raspando o Google Finance (BeautifulSoup)

Estou tentando raspar o Google Finance e obter a tabela "Ações relacionadas", com o ID "cc-table" e a classe "gf-table" com base no inspetor de páginas da web no Chrome. (Link de ...

0 a resposta

erro de codificação com read_html

Estou tentando raspar umpágina [http://simec.mec.gov.br/painelObras/recurso.php?obra=17956]. Pensei em usar o pacote rvest. No entanto, estou preso na primeira etapa, que é usar read_html para ler o conteúdo. Aqui está o meu ...

1 a resposta

Python Baixe o PDF incorporado em uma página

Eu tenho este link: http://www.equibase.com/premium/chartEmb.cfm?track=ALB&raceDate=06/17/2002&cy=USA&rn=1 [http://www.equibase.com/premium/chartEmb.cfm?track=ALB&raceDate=06/17/2002&cy=USA&rn=1] Quero baixar o PDF incorporado. Eu tentei os ...

3 a resposta

Raspando uma página wiki para a “Tabela Periódica” e todos os links

Desejo raspar o seguinte artigo da wiki: http://en.wikipedia.org/wiki/Periodic_table [http://en.wikipedia.org/wiki/Periodic_table] Para que a saída do meu código R seja uma tabela com as seguintes colunas: Nome abreviado dos elementos ...

1 a resposta

Não é possível raspar uma segunda tabela em uma página usando rvest

Consigo raspar a primeira tabela destepágina [http://www.baseball-reference.com/bio/Venezuela_born.shtml]usando o pacote rvest e usando o seguinte código: library(rvest) library(magrittr) urlbbref ...

3 a resposta

Indy - IdHttp como lidar com redirecionamentos de página?

Usando: Delphi 2010, versão mais recente do Indy Estou tentando raspar os dados da página do Googles Adsense, com o objetivo de obter os relatórios. No entanto, até agora não obtive sucesso. Para após a primeira solicitação e não ...

1 a resposta

Solicite uma fonte html totalmente renderizada em javascript em um site e encontre todas as tags iframe

Atualmente, estou tentando usar selênio e BeautifulSoup para recuperar todas as tags iframe de um site. O problema é que eu não estou obtendo todos os iframes porque existem documentos html internos na página que o BS4 não está pesquisando e não ...