Resultados da pesquisa a pedido "web-scraping"
do erro do seletor de importação scrapy.selector
Não consigo fazer o seguinte: from scrapy.selector import SelectorO erro é: O arquivo "/Desktop/KSL/KSL/spiders/spider.py", linha 1, de scrapy.selector import Selector ImportError: não é possível importar o nome Selector É como se o LXML não ...
Jsoup não está analisando o DIv particular
Não consigo obter o div'live ticker' deaqui [https://webapp.onefootball.com/en/match/real-madrid-vs-liverpool-5-718129?period=FullTime&variable=g4] usando a biblioteca Jsoup. Aqui está o meu código: Document doc = Jsoup.connect(Link).get(); ...
Não foi possível retirar o atraso codificado do meu script
Eu escrevi um script em vba em combinação com selênio para analisar todos os nomes de empresas disponíveis em uma página da web. A página da web tem o método de carregamento lento ativo, portanto, apenas 20 links ficam visíveis em cada rolagem. ...
Obter elemento com um nome de classe aleatório
Parece que o<class id> para<img class> na página do Instagram está mudando todos os dias. Agora éFFVAD e amanhã será outra coisa. Por exemplo (eu a tornei mais curta, os links são longos): <img class="FFVAD" alt="Tag your best friend" ...
Site de raspagem para dados de estoque com tags de atributo personalizadas
Estou tentando fazer uma macro para raspar informações sobre ações do investing.com com base no número ISIN do estoque. Até agora eu tenho isso: Sub Get_Stock_Data() Dim Page As New XMLHTTP60 Dim Doc As New HTMLDocument Dim inputbox As ...
erro de referência do operador de marionetes em page.evaluate
Oi eu estou aprendendo navegador decapitado sem cabeça, mas há algo que eu não entendo 1) Por que não posso usar uma variável como seletor? isso funciona const lastUpdate = await page.evaluate(() => document.querySelector('body > table > tbody ...
raspagem da web com vba usando XMLHTTP
Gostaria de obter alguns dados da página da web http://www.eex.com/en/market-data/power/derivatives-market/phelix-futures [http://www.eex.com/en/market-data/po...phelix-futures]. Se eu estiver usando o objeto InternetExplorer antigo (código ...
Análise intensiva da CPU com scrapy
A seção CONCURRENT_ITEMS em http://doc.scrapy.org/en/latest/topics/settings.html#concurrent-items [http://doc.scrapy.org/en/latest/topics/settings.html#concurrent-items]define como: Número máximo de itens simultâneos (por resposta) a serem ...
Tentei o Python BeautifulSoup e o Phantom JS: AINDA não pode raspar sites
Você pode ter visto minhas frustrações desesperadas nas últimas semanas aqui. Pesquisei alguns dados do tempo de espera e ainda não consigo coletar dados desses dois sites http://www.centura.org/erwait ...
Remover você de uma saída de arquivo da web
Oi, estou usando o Beautifulsoup para analisar um site e obter um nome como saída. Mas depois de executar o script, recebo um[u'word1', u'word2', u'word3'] resultado. O que estou procurando é'word1 word2 word3'. como se livrar dissou' e tornar o ...