Resultados da pesquisa a pedido "screen-scraping"
Não foi possível buscar meus dados de agendamento no site da minha escola. O login com cURL não funcionará
Editar Por que o menos um? O que estou tentando fazer é o seguinte: Estou tentando acessar o site da minha escola usando cURL e agendar a agenda para usá-lo para minha IA.Então preciso fazer login usando meu passe e número, mas o formulário no ...
scrapy pode ser usado para raspar conteúdo dinâmico de sites que usam AJA
Estive aprendendo Python recentemente e estou mergulhando minha mão na criação de um raspador da Web. Não é nada chique; seu único objetivo é obter os dados de um site de apostas e colocá-los no Excel. A maioria dos problemas é solucionável e ...
Salve todos os arquivos de imagem de um site
Estou criando um aplicativo pequeno para mim, onde executo um script Ruby e salvo todas as imagens do meu blog. Não consigo descobrir como salvar os arquivos de imagem depois de identificá-los. Qualquer ajuda seria muito apreciad require ...
como raspar isso com HTML simples DOM [fechado]
Estou tentando usar o dom html simples para extrair elementos de um arquivo que se parece com iss O arquivo tem várias tabelas com a mesma aparênciaclass=sometable. Cada tabela tem alguns<tr class=sometr>.Então dentro de cada tr, eu tenhoth que ...
Python urllib2.open Conexão redefinida por erro de ponto
Estou tentando raspar uma página usando python O problema é que eu continuo recebendo a conexão do Errno54 redefinida por pare O erro ocorre quando executo esse código ...
Usando Nokogiri para dividir conteúdo em tags BR
Tenho um trecho de código que estou tentando analisar com nokogiri que se parece com isso: <td class="j"> <a title="title text1" href="http://link1.com">Link 1</a> (info1), Blah 1,<br> <a title="title text2" href="http://link2.com">Link ...
Manter cookies entre solicitações de mecanização
Estou tentando usar a versão Ruby do Mechanize para extrair os tickets do meu empregador de um sistema de gerenciamento de tickets do qual estamos nos afastando que não fornece uma API. O problema é que parece que o Mechanize não está mantendo ...
HTML Parsing - Obter dados de uma tabela dentro de uma div?
Sou relativamente novo em toda a ideia de análise / raspagem de HTML. Eu esperava poder vir aqui para obter a ajuda de que preciso! Basicamente, o que estou procurando fazer (acho) é especificar o URL da página da qual desejo obter os dados. ...
Usando Ruby com o Mechanize para fazer login em um site
Preciso raspar dados de um site, mas é necessário primeiro fazer o login. Eu tenho usado o hpricot para raspar com sucesso outros sites, mas sou novo no mecanize e estou realmente desconcertado com a maneira de trabalha Vejo este exemplo ...
Codificação de caracteres adequada para exibir “& acirc; & # 128; & # 157;”?
Estou tendo alguns problemas desagradáveis na codificação de caracteres que não consigo entende Essencialmente, eu estou tela raspando algum HTML de um site usando PHP, em seguida, executando-o através do DOMDocument do PHP para alterar algumas ...