Python BeautifulSoup wyodrębnij tekst między elementami
Próbuję wyodrębnić „TO JEST MÓJ TEKST” z następującego kodu HTML:
<html>
<body>
<table>
<td class="MYCLASS">
<!-- a comment -->
<a hef="xy">Text</a>
<p>something</p>
THIS IS MY TEXT
<p>something else</p>
</br>
</td>
</table>
</body>
</html>
Próbowałem tego w ten sposób:
soup = BeautifulSoup(html)
for hit in soup.findAll(attrs={'class' : 'MYCLASS'}):
print hit.text
Ale dostaję cały tekst między wszystkimi zagnieżdżonymi tagami plus komentarz.
Czy ktoś może mi pomóc po prostu „ZOSTAĆ MOIM TEKSTEM”?