Resultados de la búsqueda a petición "jsoup"
Elimine la etiqueta adicional "a href" de la cadena html
Tengo una cadena html como esta: <a class="favourite" href="LixWQfueLU"><a href="LixWQfueLU"><font color="#009a49">Rohit Lalwani</font></a></a>Quiero hacer la cadena html: <a class="favourite" href="LixWQfueLU"><font ...
Análisis de HTML en texto sin formato formateado usando jsoup
Estaba trabajando en un proyecto de Maven que me permite analizar datos html de un sitio web. Pude analizarlo usando este código a continuación: public void parseData(){ String url = "http://stackoverflow.com/help/on-topic"; try { Document doc = ...
Iniciar sesión en Facebook a través de Jsoup
Intenté iniciar sesión en mi cuenta de Facebook con estas líneas que leí de una respuesta a una pregunta ya publicada, ¡pero no puedo iniciar sesión de ningu...
jsoup - extraer texto del artículo de wikipedia
Estoy escribiendo un código Java para realizar tareas de PNL sobre textos usando Wikipedia. ¿Cómo puedo usar JSoup para extraer todo el texto de un artículo de Wikipedia (por ejemplo, todo el texto enhttp: //en.wikipedia.org/wiki/Bosto ...
Jsoup css código selector (código xpath incluido)
Estoy intentando analizar debajo de HTML usando jsoup pero no puedo obtener la sintaxis correcta para ello.
Algoritmo optimizado para comparar plantillas de dos URLs
EDITADO, por favor, lea de nuevo, ya que agregué un trabajo míoMi tarea es comparar plantillas de dos URLS. Estoy listo con mi algoritmo. Pero toma mucho tie...
Obtener contenidos (cargados a través de AJAX) de una página web
Soy un principiante para gatear. Tengo el requisito de obtener las publicaciones y los comentarios de un enlace. Quiero automatizar este proceso. Consideré u...
Obtén el título, el contenido de la metadescripción utilizando la URL
Intento extraer el contenido de la descripción del título y la metaetiqueta de una URL, esto es lo que tengo: fin[] //urls in a string array for (int f = 0; f < fin.length; f++) { Document finaldoc = Jsoup.connect(fin[f]).get(); //fin[f] ...
Recuperando todos los enlaces de todas las páginas del resultado de búsqueda de Google usando JSoup
Tengo el siguiente código para analizar HTML en Java usando JSoup. Document linksDoc = null; linksDoc = Jsoup.connect("http://www.google.com/search?q=jbutton").userAgent("Mozilla").get(); Elements titles = linksDoc.select("h3.r > a"); ...
Cómo eliminar & nbsp; con jsoup?
No puedo quitarlo con