Resultados da pesquisa a pedido "web-scraping"
Obter variável JavaScript usando Mechanize
Eu quero obter uma variável JavaScript de https://admin.booking.com/hotel/hoteladmin [https://admin.booking.com/hotel/hoteladmin]nohead > script > var token. Não sei como essa variável é definida pelo navegador porque, quando eu recebo esta ...
Raspar texto do site usando o Excel VBA?
Sou novato em usar o Excel como raspador de página da web, mas achei isso muito artigo interessante [http://www.exceltrainingvideos.com/how-to-scrape-title-and-header-h1-from-web-pages-using-excel-vba/] explicando como raspar determinadas tags de ...
Escrevendo um programa para criar fóruns
Preciso escrever um programa para criar fóruns. Devo escrever o programa em Python usando a estrutura Scrapy ou devo usar Php cURL? Também existe um php equivalente ao Scrapy? obrigado
Como ler uma tabela html usando o Rselenium?
Estou usando o Rselenium para navegar para uma página da web. O código a seguir está fazendo isso. Eu não forneci o URL porque estou usando o URL em uma empresa que precisa de VPN para conectar-se: RSelenium::startServer() require(RSelenium) ...
Como analisar o DOM (REACT)
Estou tentando raspar dados de um site. O site usa o React do Facebook. Como tal, o código fonte que eu posso analisar usandoPasseio [http://jaunt-api.com/]é completamente diferente do código que vejo ao inspecionar os elementos usando o inspetor ...
Como isolar um único elemento de uma página da Web raspada no R
Quero usar R para raspar esta página: ( http://www.fifa.com/worldcup/archive/germany2006/results/matches/match=97410001/report.html [http://www.fifa.com/worldcup/archive/germany2006/results/matches/match=97410001/report.html] ) e outros, para ...
Raspando a página da Web com JS de reação em R
Estou tentando raspar a página abaixo:https://metro.zakaz.ua/uk/?promotion=1 [https://metro.zakaz.ua/uk/?promotion=1] Esta página com conteúdo de reação. Posso raspar a primeira página com o código: url="https://metro.zakaz.ua/uk/?promotion=1" ...
Raspar site com solicitação XML HTTP com Excel VBA: aguarde o carregamento completo da página
Estou tentando reduzir o preço de um produto de uma página da Web usando o Excel VBA. O código a seguir está funcionando ao usar a solicitação de navegação do VBA Internet Explorer. No entanto, eu gostaria de usar uma solicitação HTTP XML para ...
Como evitar um erro twisted.internet.error.ConnectionLost ao usar Scrapy?
Estou raspando algumas páginas comscrapy [http://scrapy.org/]e obtenha o seguinte erro: twisted.internet.error.ConnectionLost Minha saída de linha de comando: 2015-05-04 18:40:32+0800 [cnproxy] INFO: Spider opened 2015-05-04 ...
VBA do Excel "O método 'Documento' do objeto 'IWebBrowser2' falhou"
Estou tentando automatizar um envio de formulário no Excel para o trabalho e tenho problemas com o básico. Continuo recebendo a mensagem de erro: "O método 'Documento' do objeto 'IWebBrowser2' falhou" Com o código como está, e se eu incluir a ...