Jsoup - rozpakowywanie tekstu
Muszę wyodrębnić tekst z takiego węzła:
<code><div> Some text <b>with tags</b> might go here. <p>Also there are paragraphs</p> More text can go without paragraphs<br/> </div> </code>
I muszę zbudować:
<code>Some text <b>with tags</b> might go here. Also there are paragraphs More text can go without paragraphs </code>
Element.text
zwraca tylko całą zawartość div.Element.ownText
- wszystko, co nie jest w elementach dziecięcych. Obie są w błędzie. Iterowanie przezchildren
ignoruje węzły tekstowe.
Czy istnieje sposób na iterację zawartości elementu, aby również odbierać węzły tekstowe. Na przykład.
Węzeł tekstowy - jakiś tekstWęzeł <b> - z tagamiWęzeł tekstowy - może tutaj przejść.Węzeł <p> - Istnieją również akapityWęzeł tekstowy - więcej tekstu może przejść bez akapitówWęzeł <br> - <pusty>