Nokogiri y Xpath: encuentra todo el texto entre dos etiquetas

Question

Jun 12, 2014, 11:00 PM

Nokogiri y Xpath: encuentra todo el texto entre dos etiquetas

No estoy seguro si es una cuestión de sintaxis o diferencias en las versiones, pero parece que no puedo entender esto. Quiero tomar datos que están dentro de un (sin cierre)td desde elh2 etiqueta a lah3 etiqueta. Así es como se vería el HTML.

<td valign="top" width="350">
    <br><h2>NameIWant</h2><br>
    <br>Town<br>

    PhoneNumber<br>
    <a href="mailto:[email protected]" class="links">[email protected]</a>
    <br>
    <a href="http://websiteIwant.com" class="links">websiteIwant.com</a>
    <br><br>    
    <br><img src="images/spacer.gif"/><br>

    <h3><b>I want to stop before this!</b></h3>
    Lorem Ipsum Yadda Yadda<br>
    <img src="images/spacer.gif" border="0" width="20" height="11" alt=""/><br>
    <td width="25">
        <img src="images/spacer.gif" border="0" width="20" height="8" alt=""/>
        <td valign="top" width="200"><img src="images/spacer.gif"/>
            <br>
            <br>

            <table cellspacing="0" cellpadding="0" border="0"/>205"&gt;<tr><td>
                <a href="http://dontneedthis.com">
                </a></td></tr><br>
            <table border="0" cellpadding="3" cellspacing="0" width="200">
            ...

los<td valign> no cierra hasta el final de la página, lo que creo que podría ser la razón por la que tengo problemas.

Mi código Ruby se ve así:

require 'open-uri'
require 'nokogiri'

@doc = Nokogiri::XML(open("http://www.url.com"))

content = @doc.css('//td[valign="top"] [width="350"]')

name = content.xpath('//h2').text
puts name // Returns NameIwant

townNumberLinks = content.search('//following::h2')
puts content // Returns <h2> NameIWant </h2>

Según tengo entendido, la siguiente sintaxis debería "Selecciona todo en el documento después de la etiqueta de cierre del nodo actual". Si trato de usarpreceding me gusta:

townNumberLinks = content.search('//preceding::h3')
// I get: <h3><b>I want to stop before this!</b></h3>

Espero haber dejado claro lo que estoy tratando de hacer. ¡Gracias!

Respuestas a la pregunta(2)

Preguntas populares

0 la respuesta

Cómo configurar la primera aplicación en Zend Framework 2

0 la respuesta

Flip vertical de CGContext

0 la respuesta

¿La forma más fácil (legal) de obtener programáticamente el conteo de resultados de búsqueda de Google?

0 la respuesta

Reutilizando Sesiones SSL en Android con HttpClient

0 la respuesta

Usando Angularjs $ http en la consola del navegador

¡Eres muy activo! ¡Es genial!

Nokogiri y Xpath: encuentra todo el texto entre dos etiquetas

Respuestas a la pregunta(2)

Su respuesta a la pregunta

Preguntas populares