Resultados da pesquisa a pedido "web-scraping"
JSON VBA Analisar para Excel
Eu tenho algumas análises JSON funcionando. Eu uso o VBA para analisar um código JSON do meu servidor da Web, escreva-o na célula A1 na minha planilha do Excel. Mas não consigo que isso se converta nas outras células. Aqui está minha amostra ...
R Como verificar se o XPath existe
esperando que alguém mais experiente que eu possa lançar alguma luz aqui. Como parte de um raspador da Web maior, desejo extrair metadados de um conjunto de páginas. Quando eu executei isso, a investigação caiu e isso ocorreu devido ...
O URL de solicitação XHR diz que não existe ao tentar analisar seu conteúdo
Antes de criar uma solução completa para o meu problema usando o Scrapy, estou postando uma versão simplista do que quero fazer: import requests url ...
Rolagem de página da Web usando o selenium python webdriver
Estou raspando esta página da Web para nomes de usuários que carregam os usuários após rolar URL para a página: "http://www.quora.com/Kevin-Rose/followers [http://www.quora.com/Kevin-Rose/followers]" Conheço o número de usuários na página ...
Raspe valores de tags de seleção / opção HTML em R
Estou tentando (sem êxito) raspar alguns dados de um site (www.majidata.co.ke) usando R. Eu consegui raspar o HTML e analisá-lo, mas agora um pouco inseguro sobre como extrair os bits, na verdade necessidade! Usando oXML biblioteca raspe meus ...
Usando solicitações e BeautifulSoup - Python retorna a tag sem texto
Estou tentando capturar o número de visitas nesta página, mas python retorna a tag sem texto. Isto é o que eu fiz. import requests from bs4 import BeautifulSoup r ...
BeautifulSoup se comporta de maneira diferente na máquina Amazon EC2
Estou executando o seguinte script: from bs4 import BeautifulSoup import urllib2 import sys print sys.version url = 'https://www.google.com/finance' page = urllib2.urlopen(url).read() soup = BeautifulSoup(page) trends_tag = soup.find('div', ...
Limitando solicitações com vários proxies
No momento, estou atribuindo proxies aleatórios a solicitações por meio de um middleware personalizado. Eu gostaria de limitar a limitação do download para o proxy específico que a solicitação está usando, mas, tanto quanto posso dizer, pronto ...
Como você raspa páginas AJAX?
Por favor, informe como raspar páginas AJAX.
Raspe várias páginas com BeautifulSoup e Python
Meu código raspa com êxito as tags tr align = center de [ http://my.gwu.edu/mod/pws/courses.cfm?campId=1&termId=201501&subjId=ACCY [http://my.gwu.edu/mod/pws/courses.cfm?campId=1&termId=201501&subjId=ACCY]] e grava os elementos td em um arquivo ...