Resultados da pesquisa a pedido "web-scraping"

3 a resposta

Falha ao capturar datas de maneira personalizada de um conteúdo tabular

Eu escrevi um script em python em combinação com selênio para analisar algumas datas disponíveis em uma tabela em uma página da web. A tabela está localizada sob o cabeçalhoNPL Victoria Betting Odds. Os dados tabulares estão dentro ...

2 a resposta

Como obter a lista completa do histórico de revisões da Wikipedia de algum artigo?

Como posso obter a lista completa do histórico de revisões da Wikipedia? (Não quero raspar) import wapiti import pdb import pylab as plt client = wapiti.WapitiClient('[email protected]') get_revs = client.get_page_revision_infos( ...

2 a resposta

Dados de vendas da Amazon (com Excel VBA)

Estou tentando obter o número do resultado (no código HTML) de cada palavra-chave que busco por meio do Excel VBA. Limitando os critérios por className, id e data-asin, mas esse último está se mostrando complicado, pois o VBA ainda não suporta ...

1 a resposta

<erro urlopen [Erro 1] _ssl.c: 510: erro: 14077417: SSL

Alguém sabe por que estou recebendo esse erro? SSLError: [Errno 1] _ssl.c:510: error:14077438:SSL routines:SSL23_GET_SERVER_HELLO:tlsv1Eu recebo o erro ao usar pedidos ou urllib2, estou executando o código no Kodi. O código funciona bem quando ...

4 a resposta

Baixe arquivos .xls de uma página da Web usando Python e BeautifulSoup

Eu quero baixar todos os.xls ou.xlsx ou.csv deste site para uma pasta especificada. https://www.rbi.org.in/Scripts/bs_viewcontent.aspx?Id=2009Eu procurei mecanizar, sopa bonita, urllib2 etc. O mecanizar não funciona no Python 3, o urllib2 ...

2 a resposta

Sopa bonita se a classe “contiver” ou Regex?

Se os nomes das minhas turmas são constantemente diferentes, digamos, por exemplo: listing-col-line-3-11 dpt 41 listing-col-block-1-22 dpt 41 listing-col-line-4-13 CWK 12Normalmente eu poderia fazer: for EachPart in soup.find_all("div", ...

1 a resposta

Localizando correspondências parciais em uma tag href

Estou tentando usar a sopa bonita para encontrar todas<a> elementos onde ohref O atributo inclui uma determinada sequência. Um exemplo do elemento completo é: <a href="/markets/NZSX/securities/ABA">ABA</a>Eu estou procurando por todos ...

1 a resposta

Raspagem na Web Python (Beautiful Soup, Selenium e PhantomJS): Raspando apenas parte da página inteira

Olá, estou com problemas para tentar coletar dados de um site para fins de modelagem (fantsylabs dotcom). Eu sou apenas um hack, então perdoe minha ignorância na linguagem da ficção científica. O que estou tentando realizar é ... Use o selênio ...

3 a resposta

Buscar todo o link href usando selênio em python

Estou praticando selênio em python e queria buscar todos os links em uma página da web usando selênio. Por exemplo, quero todos os links na tag 'a href "deste site: http://psychoticelites.com/ [http://psychoticelites.com/] Eu escrevi um script ...

1 a resposta

Python dryscrape raspar página com cookies

Quero obter alguns dados do site, o que requer login. Eu entro pertosolicitações de url = "http://example.com" response = requests.get(url, {"email":"[email protected]", "password":"12345"}) cookies = response.cookiesEntão eu quero obter dados ...