извлечь одну строку из HTML, используя Ruby / Mechanize (и Nokogiri)
Я извлекаю данные с форума. Мой сценарийоснованный на работает нормально. Теперь мне нужно извлечь дату и время (21 декабря 2009, 20:39) из одного поста. Я не могу заставить это работать. Я использовал FireXPath для определения xpath.
Образец кода:
require 'rubygems'
require 'mechanize'
post_agent = WWW::Mechanize.new
post_page = post_agent.get('http://www.vbulletin.org/forum/showthread.php?t=230708')
puts post_page.parser.xpath('/html/body/div/div/div/div/div/table/tbody/tr/td/div[2]/text()').to_s.strip
puts post_page.parser.at_xpath('/html/body/div/div/div/div/div/table/tbody/tr/td/div[2]/text()').to_s.strip
puts post_page.parser.xpath('//[@id="post1960370"]/tbody/tr[1]/td/div[2]/text()')
все мои попытки заканчиваются пустой строкой или ошибкой.
Я не могу найти никакой документации по использованию Nokogiri в Mechanize.Документация по механизации говорит внизу страницы:
После того, как вы использовали Mechanize, чтобы перейти к странице, которую нужно очистить, затем очистите ее, используя методы Нокогири.
Но какие методы? Где я могу прочитать о них с примерами и объясненным синтаксисом? Я не нашел ничего наNokogiri»с сайта или.