Obtener datos entre dos etiquetas en Python

Question

May 26, 2013, 01:10 PM

Obtener datos entre dos etiquetas en Python

<h3>
<a href="article.jsp?tp=&arnumber=16">
Granular computing based
<span class="snippet">data</span>
<span class="snippet">mining</span>
in the views of rough set and fuzzy set
</a>
</h3>

Utilizando Python, quiero obtener los valores de la etiqueta de anclaje, que debe ser la minería de datos basada en computación granular en las vistas de conjunto aproximado y conjunto difuso

Intenté usar lxml

parser = etree.HTMLParser()
tree   = etree.parse(StringIO.StringIO(html), parser)                   
xpath1 = "//h3/a/child::text() | //h3/a/span/child::text()"
rawResponse = tree.xpath(xpath1)              
print rawResponse

y obteniendo la siguiente salida

['\r\n\t\t','\r\n\t\t\t\t\t\t\t\t\tgranular computing based','data','mining','in the view of roughset and fuzzyset\r\n\t\t\t\t\t\t\]

Respuestas a la pregunta(2)

Preguntas populares

0 la respuesta

Pyplot combina múltiples etiquetas de línea en la leyenda

0 la respuesta

Cómo comprobar si el archivo está disponible en la memoria interna.

0 la respuesta

Ventajas de la sobrecarga del constructor

0 la respuesta

Cómo consultar clases con propiedad de objeto en Sparql

0 la respuesta

Elimine las funciones de tiempo de ejecución que no se hayan utilizado, lo que hace que el ejecutable (GCC)

¡Eres muy activo! ¡Es genial!

Obtener datos entre dos etiquetas en Python

Respuestas a la pregunta(2)

Su respuesta a la pregunta

Preguntas populares