Capivara, Poltergeist e Phantomjs e dando uma resposta vazia no corpo
Estou recebendo um documento vazio de volta de phantomjs. Eu estou tentando usar Capybara e Poltergeist para configurar o driver phantomjs para Capivara.
Eu criei um módulo da seguinte forma e incluí-lo no arquivo que usa precisa se conectar.
require 'capybara/poltergeist'
module Parser
module JSParser
include Capybara
# Create a new PhantomJS session in Capybara
def new_session
# Register PhantomJS (aka poltergeist) as the driver to use
Capybara.register_driver :poltergeist do |app|
Capybara::Poltergeist::Driver.new(app, :debug => true)
end
# Use XPath as the default selector for the find method
Capybara.default_selector = :xpath
Capybara.javascript_driver = :poltergeist
Capybara.current_driver = :poltergeist
# Start up a new thread
@session = Capybara::Session.new(:poltergeist)
# Report using a particular user agent
@session.driver.headers = { 'User-Agent' => 'Mozilla/5.0 (Macintosh; Intel Mac OS X)' }
# Return the driver's session
@session
end
# Returns the current session's page
def html
@session.html
end
end
end
Em seguida, carregando a página da seguinte maneira:
class Loader
include Parser::JSParser
def load_page
new_session
visit "http://www.smashingmagazine.com"
#let phantomjs take its time
sleep 5
puts "html=#{html}"
end
end
Então, finalmente, chamando o load_page
Loader.new.load_page
Aqui está a resposta de depuração do poltergeist
poltergeist [1364758785355] state default -> loading
{"response"=>true}
{"name"=>"visit", "args"=>["http://www.smashingmagazine.com"]}
poltergeist [1364758794574] state loading -> default
{"response"=>{"status"=>"success"}}
{"name"=>"body", "args"=>[]}
{"response"=>"<html><head></head><body></body></html>"}
Como você pode ver, a resposta é apenas um documento em branco com apenas as tags html, head e body, mas nada na tag body.
Que errado estou fazendo? Observando o tráfego de rede, estou obtendo a resposta completa do host (smashingmagazine.com neste caso). É depois que a resposta retorna que não sei o que está acontecendo. Às vezes o phantomjs também está falhando e em outras ocasiões, ele passa com o corpo vazio. Aqui está a última linha que é impressa no STDERR quando o phantomjs falha
PhantomJS client died while processing {"name":"visit","args":["http://www.smashingmagazine.com"]}