Resultados da pesquisa a pedido "web-scraping"

1 a resposta

JSON VBA Analisar para Excel

Eu tenho algumas análises JSON funcionando. Eu uso o VBA para analisar um código JSON do meu servidor da Web, escreva-o na célula A1 na minha planilha do Excel. Mas não consigo que isso se converta nas outras células. Aqui está minha amostra ...

2 a resposta

R Como verificar se o XPath existe

esperando que alguém mais experiente que eu possa lançar alguma luz aqui. Como parte de um raspador da Web maior, desejo extrair metadados de um conjunto de páginas. Quando eu executei isso, a investigação caiu e isso ocorreu devido ...

1 a resposta

O URL de solicitação XHR diz que não existe ao tentar analisar seu conteúdo

Antes de criar uma solução completa para o meu problema usando o Scrapy, estou postando uma versão simplista do que quero fazer: import requests url ...

1 a resposta

Rolagem de página da Web usando o selenium python webdriver

Estou raspando esta página da Web para nomes de usuários que carregam os usuários após rolar URL para a página: "http://www.quora.com/Kevin-Rose/followers [http://www.quora.com/Kevin-Rose/followers]" Conheço o número de usuários na página ...

2 a resposta

Raspe valores de tags de seleção / opção HTML em R

Estou tentando (sem êxito) raspar alguns dados de um site (www.majidata.co.ke) usando R. Eu consegui raspar o HTML e analisá-lo, mas agora um pouco inseguro sobre como extrair os bits, na verdade necessidade! Usando oXML biblioteca raspe meus ...

1 a resposta

Usando solicitações e BeautifulSoup - Python retorna a tag sem texto

Estou tentando capturar o número de visitas nesta página, mas python retorna a tag sem texto. Isto é o que eu fiz. import requests from bs4 import BeautifulSoup r ...

1 a resposta

BeautifulSoup se comporta de maneira diferente na máquina Amazon EC2

Estou executando o seguinte script: from bs4 import BeautifulSoup import urllib2 import sys print sys.version url = 'https://www.google.com/finance' page = urllib2.urlopen(url).read() soup = BeautifulSoup(page) trends_tag = soup.find('div', ...

1 a resposta

Limitando solicitações com vários proxies

No momento, estou atribuindo proxies aleatórios a solicitações por meio de um middleware personalizado. Eu gostaria de limitar a limitação do download para o proxy específico que a solicitação está usando, mas, tanto quanto posso dizer, pronto ...

10 a resposta

Como você raspa páginas AJAX?

Por favor, informe como raspar páginas AJAX.

1 a resposta

Raspe várias páginas com BeautifulSoup e Python

Meu código raspa com êxito as tags tr align = center de [ http://my.gwu.edu/mod/pws/courses.cfm?campId=1&termId=201501&subjId=ACCY [http://my.gwu.edu/mod/pws/courses.cfm?campId=1&termId=201501&subjId=ACCY]] e grava os elementos td em um arquivo ...