Resultados da pesquisa a pedido "screen-scraping"

1 a resposta

Selecione todos os <p> 's dos filhos de um Nó usando HTMLAgilityPack

Eu tenho o seguinte código que estou usando para obter uma página html. Torne os URLs absolutos e faça com que os links sejam seguidos e abertos em uma nova janela / guia. Meu problema é em torno da adição dos atributos ao<a>s. string url = ...

1 a resposta

Por que essa operação HtmlAgilityPack é inválida quando há, de fato, elementos correspondentes?

Recebo "InvalidOperationException> Message = Sequence não contém nenhum elemento correspondente" com o seguinte código: private void buttonLoadHTML_Click(object sender, EventArgs e) { GetParagraphsListFromHtml(@"C:\PlatypiRUs\fitt.html"); } // ...

1 a resposta

Raspando os resultados da página inicial do Google com php

eu posso com o código php Raspando título e URL dos resultados de pesquisa do Google agora como obter descrições $url = 'http://www.google.com/search?hl=en&safe=active&tbo=d&site=&source=hp&q=Beautiful+Bangladesh&oq=Beautiful+Bangladesh'; $html ...

1 a resposta

Tirando screenshots confiáveis de sites? Phantomjs e Casperjs retornam capturas de tela vazias em alguns sites

Abra uma página da web e faça uma captura de tela. Usando ONLY phantomjs: (este é um script simples, na verdade, é o exemplo de script usado em seus ...

1 a resposta

Raspando dados do Silverlight Control no navegador

Uso os aplicativos VBA e WPF do Excel para coletar dados de vários sites e tudo correu bem. Mas agora encontrei algo que não consigo superar. O site está exibindo seus dados em um controle do Silverlight: <OBJECT width="100%" height=400 ...

1 a resposta

Como executar o teste de fumaça na Web viável com o Selenium WebDriver?

Tenho pesquisado sobre o teste de carregamento de páginas da Web mais rápido e viável comSelenium. Uma idéia geral do teste de fumaça é clicar e navegar por todo o site para garantir que as páginas sejam carregadas corretamente. Eu estava ...

1 a resposta

Subpáginas BeautifulSoup da lista com paginação "carregar mais"

Muito novo aqui, então peço desculpas antecipadamente. Estou procurando obter uma lista de todas as descrições de empresas dehttps://angel.co/companies [https://angel.co/companies]para brincar. As ferramentas de análise baseadas na Web que eu ...

1 a resposta

JSoup - Selecionar todos os comentários

Quero selecionar todos os comentários de um documento usando JSoup. Eu gostaria de fazer algo assim: for(Element e : doc.select("comment")) { System.out.println(e); }Eu tentei isso: for (Element e : doc.getAllElements()) { if (e instanceof ...

1 a resposta

Raspagem na web de supermercados na Argentina

Estou tentando extrair dados do site: https://www.disco.com.ar/Comprar/Home.aspx#_atCategory=false&_atGrilla=true&_id=21063 [https://www.disco.com.ar/Comprar/Home.aspx#_atCategory=false&_atGrilla=true&_id=21063] através de uma macroExcel 2013, ...

1 a resposta

Usando Python e Mechanize para enviar dados de formulário e autenticar

Quero enviar o login para o site Reddit.com, navegar para uma área específica da página e enviar um comentário. Não vejo o que há de errado com esse código, mas não está funcionando porque nenhuma alteração é refletida no site do Reddit. import ...