Resultados da pesquisa a pedido "web-scraping"

3 a resposta

do erro do seletor de importação scrapy.selector

Não consigo fazer o seguinte: from scrapy.selector import SelectorO erro é: O arquivo "/Desktop/KSL/KSL/spiders/spider.py", linha 1, de scrapy.selector import Selector ImportError: não é possível importar o nome Selector É como se o LXML não ...

1 a resposta

Jsoup não está analisando o DIv particular

Não consigo obter o div'live ticker' deaqui [https://webapp.onefootball.com/en/match/real-madrid-vs-liverpool-5-718129?period=FullTime&variable=g4] usando a biblioteca Jsoup. Aqui está o meu código: Document doc = Jsoup.connect(Link).get(); ...

6 a resposta

Não foi possível retirar o atraso codificado do meu script

Eu escrevi um script em vba em combinação com selênio para analisar todos os nomes de empresas disponíveis em uma página da web. A página da web tem o método de carregamento lento ativo, portanto, apenas 20 links ficam visíveis em cada rolagem. ...

2 a resposta

Obter elemento com um nome de classe aleatório

Parece que o<class id> para<img class> na página do Instagram está mudando todos os dias. Agora éFFVAD e amanhã será outra coisa. Por exemplo (eu a tornei mais curta, os links são longos): <img class="FFVAD" alt="Tag your best friend" ...

1 a resposta

Site de raspagem para dados de estoque com tags de atributo personalizadas

Estou tentando fazer uma macro para raspar informações sobre ações do investing.com com base no número ISIN do estoque. Até agora eu tenho isso: Sub Get_Stock_Data() Dim Page As New XMLHTTP60 Dim Doc As New HTMLDocument Dim inputbox As ...

2 a resposta

erro de referência do operador de marionetes em page.evaluate

Oi eu estou aprendendo navegador decapitado sem cabeça, mas há algo que eu não entendo 1) Por que não posso usar uma variável como seletor? isso funciona const lastUpdate = await page.evaluate(() => document.querySelector('body > table > tbody ...

1 a resposta

raspagem da web com vba usando XMLHTTP

Gostaria de obter alguns dados da página da web http://www.eex.com/en/market-data/power/derivatives-market/phelix-futures [http://www.eex.com/en/market-data/po...phelix-futures]. Se eu estiver usando o objeto InternetExplorer antigo (código ...

2 a resposta

Análise intensiva da CPU com scrapy

A seção CONCURRENT_ITEMS em http://doc.scrapy.org/en/latest/topics/settings.html#concurrent-items [http://doc.scrapy.org/en/latest/topics/settings.html#concurrent-items]define como: Número máximo de itens simultâneos (por resposta) a serem ...

1 a resposta

Tentei o Python BeautifulSoup e o Phantom JS: AINDA não pode raspar sites

Você pode ter visto minhas frustrações desesperadas nas últimas semanas aqui. Pesquisei alguns dados do tempo de espera e ainda não consigo coletar dados desses dois sites http://www.centura.org/erwait ...

3 a resposta

Remover você de uma saída de arquivo da web

Oi, estou usando o Beautifulsoup para analisar um site e obter um nome como saída. Mas depois de executar o script, recebo um[u'word1', u'word2', u'word3'] resultado. O que estou procurando é'word1 word2 word3'. como se livrar dissou' e tornar o ...