извлечь одну строку из HTML, используя Ruby / Mechanize (и Nokogiri)

Question

Jan 22, 2010, 03:07 AM

ruby parsing information-extraction nokogiri

извлечь одну строку из HTML, используя Ruby / Mechanize (и Nokogiri)

Я извлекаю данные с форума. Мой сценарийоснованный на работает нормально. Теперь мне нужно извлечь дату и время (21 декабря 2009, 20:39) из одного поста. Я не могу заставить это работать. Я использовал FireXPath для определения xpath.

Образец кода:

 require 'rubygems'
 require 'mechanize'

   post_agent = WWW::Mechanize.new
    post_page = post_agent.get('http://www.vbulletin.org/forum/showthread.php?t=230708')
    puts  post_page.parser.xpath('/html/body/div/div/div/div/div/table/tbody/tr/td/div[2]/text()').to_s.strip
    puts  post_page.parser.at_xpath('/html/body/div/div/div/div/div/table/tbody/tr/td/div[2]/text()').to_s.strip
    puts post_page.parser.xpath('//[@id="post1960370"]/tbody/tr[1]/td/div[2]/text()')

все мои попытки заканчиваются пустой строкой или ошибкой.

Я не могу найти никакой документации по использованию Nokogiri в Mechanize.Документация по механизации говорит внизу страницы:

После того, как вы использовали Mechanize, чтобы перейти к странице, которую нужно очистить, затем очистите ее, используя методы Нокогири.

Но какие методы? Где я могу прочитать о них с примерами и объясненным синтаксисом? Я не нашел ничего наNokogiri»с сайта или.

извлечь одну строку из HTML, используя Ruby / Mechanize (и Nokogiri)

Ответы на вопрос(2)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

извлечь одну строку из HTML, используя Ruby / Mechanize (и Nokogiri)

Ответы на вопрос(2)

Ваш ответ на вопрос

Популярные вопросы