Pobierz HTML pod tagiem za pomocą pythona htmlparser
Chcę pobrać cały HTML pod tagiem i użyć HTMLParser. Jestem w stanie obecnie uzyskać dane między tagami, a następujący kod to mój kod
class LinksParser(HTMLParser):
def __init__(self):
HTMLParser.__init__(self)
self.recording = 0
self.data = ''
def handle_starttag(self, tag, attributes):
if tag != 'span':
return
if self.recording:
self.recording += 1
return
for name, value in attributes:
if name == 'itemprop' and value == 'description':
break
else:
return
self.recording = 1
def handle_endtag(self, tag):
if tag == 'span' and self.recording:
self.recording -= 1
def handle_data(self, data):
if self.recording:
self.data += data
Na przykład chcę również, aby znaczniki html znajdowały się wewnątrz wejścia
<span itemprop="description">
<h1>My First Heading</h1>
<p>My first <br/><br/>paragraph.</p>
</span>
gdy zostanie podany jako dane wejściowe, da mi tylko dane bez tagów. Czy jest jakaś metoda, dzięki której mogę uzyskać cały HTML pomiędzy tagami?