Analisando HTML em Texto Simples Formatado Usando jsoup
Eu estava trabalhando em um projeto maven que me permite analisar dados html de um site. Consegui analisá-lo usando este código abaixo:
public void parseData(){
String url = "http://stackoverflow.com/help/on-topic";
try {
Document doc = Jsoup.connect(url).get();
Element essay = doc.select("div.col-section").first();
String essayText = essay.text();
jTextAreaAdem.setText(essayText);
} catch (IOException ex) {
Logger.getLogger(formAdem.class.getName()).log(Level.SEVERE, null, ex);
}
}
Até agora não tenho problemas. Eu posso analisar os dados html. Eu estava usando o método select do jsoup e recuperando dados usando "div.col-section", o que significa que estou procurando pelo elemento div com a classe is col-section. Eu queria imprimir os dados em uma área de texto. O resultado que tenho é um parágrafo enorme, mesmo que os dados reais no site tenham mais de um parágrafo. Então, como analisar os dados como os do site?