Biblioteca para analisar arquivos ERB

Estou tentando analisar, não avaliar, trilhos arquivos ERB de maneira do tipo Hpricot / Nokogiri. Os arquivos que estou tentando analisar contêm fragmentos HTML misturados ao conteúdo dinâmico gerado usando ERB (arquivos de exibição de trilhos padrão). Estou procurando uma biblioteca que não apenas analise o conteúdo ao redor, da mesma forma que Hpricot ou Nokogiri, mas também tratará os símbolos do ERB, <%, <% = etc, como se fossem tags html / xml.

Idealmente, eu retornaria uma estrutura do tipo DOM, na qual os símbolos <%, <% = etc seriam incluídos como seus próprios tipos de nós.

Eu sei que é possível hackear algo em conjunto usando expressões regulares, mas eu estava procurando por algo um pouco mais confiável, pois estou desenvolvendo uma ferramenta que eu preciso executar em uma base de código de exibição muito grande, onde o conteúdo html e o erb são importantes.

Por exemplo, conteúdo como:

blah blah blah
<div>My Great Text <%= my_dynamic_expression %></div>

Retornaria uma estrutura de árvore como:

root
 - text_node (blah blah blah)
 - element (div)
    - text_node (My Great Text )
        - erb_node (<%=)

questionAnswers(2)

yourAnswerToTheQuestion