Resultados de la búsqueda a petición "html-parsing"

1 la respuesta

¿Cuál es el mejor paquete ordenado de HTML? ¿Hay alguna opción en el paquete de agilidad HTML para ordenar la página web HTML?

estoy usandopaquete de agilidad htmlanalizar htmlinformación tabular. Ahora hay algo de contenido html con las etiquetas finales faltantes y de dicha página debido a las etiquetas finales faltantes, el paquete de agilidad html no analiza la ...

1 la respuesta

Cómo obtener HTML de un hermoso objeto de sopa

Tengo la siguiente lista de objetos bs4: >>> listing <div class="listingHeader"> <h2> .... >>> type(listing) <class 'bs4.element.Tag'>Quiero extraer el html sin procesar como una cadena. He intentado: >>> a = listing.contents >>> type(a) <type ...

1 la respuesta

Cómo extraer enlaces html con una palabra coincidente de un sitio web usando python

Tengo una url, digamoshttp://www.bbc.com/news/world/asia/. Justo en esta página quería extraer todos los enlaces que tiene India o INDIA o india (debe ser insensible a mayúsculas y minúsculas). Si hago clic en cualquiera de los enlaces de ...

1 la respuesta

Recuperando todos los enlaces de todas las páginas del resultado de búsqueda de Google usando JSoup

Tengo el siguiente código para analizar HTML en Java usando JSoup. Document linksDoc = null; linksDoc = Jsoup.connect("http://www.google.com/search?q=jbutton").userAgent("Mozilla").get(); Elements titles = linksDoc.select("h3.r > a"); ...

1 la respuesta

Jsoup: extracción de texto interno de la etiqueta de anclaje

Aquí está mi problema. Tengo un contenido html: innerText Necesito extraer el "innerText". Mientras intentaba esto en Jsoup, descubrí que el texto interno sale de la etiqueta de anclaje cuando Jsoup lo analiza. Aquí está mi código Document ...

1 la respuesta

¿Cómo extraer el texto entre la etiqueta de anclaje en PHP?

Tengo una cadena en una variable titulada$message como sigue : $message = 'posted an event in <a href="http://52.1.47.143/group/186/">TEST PRA</a>';Solo quiero obtener el texto dentro de la etiqueta de anclaje, es decirPRUEBA PRAen este caso ...

1 la respuesta

análisis / extracción de una tabla HTML, sitio web en Java

Quiero analizar el contenido de esta tabla HTML: Aquí está el sitio web completo con el código ...

1 la respuesta

¿Forma rápida y efectiva de analizar HTML roto?

Estoy trabajando en proyectos grandes que requieren un análisis rápido de HTML, incluida la recuperación de páginas HTML rotas. Actualmente, lxml es mi elección, sé que también proporciona una interfaz para el modo de recuperación de libxml2, ...

1 la respuesta

¿Cómo uso libcurl para iniciar sesión en un sitio web seguro y acceder al html detrás del inicio de sesión?

Hola chicos, me preguntaba si ustedes podrían ayudarme a trabajar accediendo al html detrás de una página de inicio de sesión usando C y libcurl. Ejemplo especifico: El sitio web al que intento acceder ...

1 la respuesta

beautifulsoup: find_all en bs4.element.ResultSet objeto o lista?

Hola, entonces aplico find_all en unbeautifulsoup objecty encontrar algo, que es unbs4.element.ResultSet object o unlist. Quiero hacer más find_all allí, pero no está permitido en unbs4.element.ResultSet object. Puedo recorrer cada ...