Resultados da pesquisa a pedido "screen-scraping"
Selecione todos os <p> 's dos filhos de um Nó usando HTMLAgilityPack
Eu tenho o seguinte código que estou usando para obter uma página html. Torne os URLs absolutos e faça com que os links sejam seguidos e abertos em uma nova janela / guia. Meu problema é em torno da adição dos atributos ao<a>s. string url = ...
Por que essa operação HtmlAgilityPack é inválida quando há, de fato, elementos correspondentes?
Recebo "InvalidOperationException> Message = Sequence não contém nenhum elemento correspondente" com o seguinte código: private void buttonLoadHTML_Click(object sender, EventArgs e) { GetParagraphsListFromHtml(@"C:\PlatypiRUs\fitt.html"); } // ...
Raspando os resultados da página inicial do Google com php
eu posso com o código php Raspando título e URL dos resultados de pesquisa do Google agora como obter descrições $url = 'http://www.google.com/search?hl=en&safe=active&tbo=d&site=&source=hp&q=Beautiful+Bangladesh&oq=Beautiful+Bangladesh'; $html ...
Tirando screenshots confiáveis de sites? Phantomjs e Casperjs retornam capturas de tela vazias em alguns sites
Abra uma página da web e faça uma captura de tela. Usando ONLY phantomjs: (este é um script simples, na verdade, é o exemplo de script usado em seus ...
Raspando dados do Silverlight Control no navegador
Uso os aplicativos VBA e WPF do Excel para coletar dados de vários sites e tudo correu bem. Mas agora encontrei algo que não consigo superar. O site está exibindo seus dados em um controle do Silverlight: <OBJECT width="100%" height=400 ...
Como executar o teste de fumaça na Web viável com o Selenium WebDriver?
Tenho pesquisado sobre o teste de carregamento de páginas da Web mais rápido e viável comSelenium. Uma idéia geral do teste de fumaça é clicar e navegar por todo o site para garantir que as páginas sejam carregadas corretamente. Eu estava ...
Subpáginas BeautifulSoup da lista com paginação "carregar mais"
Muito novo aqui, então peço desculpas antecipadamente. Estou procurando obter uma lista de todas as descrições de empresas dehttps://angel.co/companies [https://angel.co/companies]para brincar. As ferramentas de análise baseadas na Web que eu ...
JSoup - Selecionar todos os comentários
Quero selecionar todos os comentários de um documento usando JSoup. Eu gostaria de fazer algo assim: for(Element e : doc.select("comment")) { System.out.println(e); }Eu tentei isso: for (Element e : doc.getAllElements()) { if (e instanceof ...
Raspagem na web de supermercados na Argentina
Estou tentando extrair dados do site: https://www.disco.com.ar/Comprar/Home.aspx#_atCategory=false&_atGrilla=true&_id=21063 [https://www.disco.com.ar/Comprar/Home.aspx#_atCategory=false&_atGrilla=true&_id=21063] através de uma macroExcel 2013, ...
Usando Python e Mechanize para enviar dados de formulário e autenticar
Quero enviar o login para o site Reddit.com, navegar para uma área específica da página e enviar um comentário. Não vejo o que há de errado com esse código, mas não está funcionando porque nenhuma alteração é refletida no site do Reddit. import ...