Pobierz HTML pod tagiem za pomocą pythona htmlparser

Question

Nov 11, 2012, 07:22 PM

Pobierz HTML pod tagiem za pomocą pythona htmlparser

Chcę pobrać cały HTML pod tagiem i użyć HTMLParser. Jestem w stanie obecnie uzyskać dane między tagami, a następujący kod to mój kod

class LinksParser(HTMLParser):
  def __init__(self):
    HTMLParser.__init__(self)
    self.recording = 0
    self.data = ''

  def handle_starttag(self, tag, attributes):
    if tag != 'span':
      return
    if self.recording:
      self.recording += 1
      return
    for name, value in attributes:
      if name == 'itemprop' and value == 'description':
        break
    else:
      return
    self.recording = 1

  def handle_endtag(self, tag):
    if tag == 'span' and self.recording:
      self.recording -= 1

  def handle_data(self, data):
    if self.recording:
      self.data += data

Na przykład chcę również, aby znaczniki html znajdowały się wewnątrz wejścia

<span itemprop="description">
<h1>My First Heading</h1>
<p>My first <br/><br/>paragraph.</p>
</span>

gdy zostanie podany jako dane wejściowe, da mi tylko dane bez tagów. Czy jest jakaś metoda, dzięki której mogę uzyskać cały HTML pomiędzy tagami?

questionAnswers(2)

Popularne pytania

0 odpowiedzi

Podczas ukrywania paska stanu mój pasek nawigacji przesuwa się w górę w systemie iOS7

0 odpowiedzi

ColdFusion 9: int i type = „numeryczny” nieprzyjemny błąd?

0 odpowiedzi

Powiązanie modelu ASP.NET MVC z listBoxFor i DropDownListFor Pomocnicy

0 odpowiedzi

W jaki sposób mogę przechowywać wiele wartości na klucz w tabeli mieszania za pomocą Node.JS?

0 odpowiedzi

Eclipse Kepler Crash po uruchomieniu za pomocą komunikatu: przestrzeń sterty Java

Jesteś bardzo aktywny! To świetnie!

Pobierz HTML pod tagiem za pomocą pythona htmlparser

questionAnswers(2)

yourAnswerToTheQuestion

Popularne pytania