Jsoup - rozpakowywanie tekstu

Question

Apr 16, 2012, 06:19 PM

Jsoup - rozpakowywanie tekstu

Muszę wyodrębnić tekst z takiego węzła:

<code><div>
    Some text <b>with tags</b> might go here.
    <p>Also there are paragraphs</p>
    More text can go without paragraphs<br/>
</div>
</code>

I muszę zbudować:

<code>Some text <b>with tags</b> might go here.
Also there are paragraphs
More text can go without paragraphs
</code>

Element.text zwraca tylko całą zawartość div.Element.ownText - wszystko, co nie jest w elementach dziecięcych. Obie są w błędzie. Iterowanie przezchildren ignoruje węzły tekstowe.

Czy istnieje sposób na iterację zawartości elementu, aby również odbierać węzły tekstowe. Na przykład.

Węzeł tekstowy - jakiś tekstWęzeł <b> - z tagamiWęzeł tekstowy - może tutaj przejść.Węzeł <p> - Istnieją również akapityWęzeł tekstowy - więcej tekstu może przejść bez akapitówWęzeł <br> - <pusty>