Jsoup - extrair texto
Eu preciso extrair texto de um nó como este:
<code><div> Some text <b>with tags</b> might go here. <p>Also there are paragraphs</p> More text can go without paragraphs<br/> </div> </code>
E eu preciso construir:
<code>Some text <b>with tags</b> might go here. Also there are paragraphs More text can go without paragraphs </code>
Element.text
retorna apenas todo o conteúdo do div.Element.ownText
- tudo o que não está dentro dos elementos filhos. Ambos estão errados. Iterando através dechildren
ignora nós de texto.
Existe uma maneira de iterar o conteúdo de um elemento para receber nós de texto também. Por exemplo.
Nó de texto - algum textoNó <b> - com tagsNó de texto - pode ir aqui.Nó <p> - Também há parágrafosNó de texto - mais texto pode ficar sem parágrafosNó <br> - <vazio>