Obtenha o html sob uma tag usando o htmlparser python

Question

Nov 11, 2012, 07:22 PM

Obtenha o html sob uma tag usando o htmlparser python

Eu quero ficar todo html em uma tag e usando o HTMLParser. Eu sou capaz de obter os dados entre as tags e seguir é o meu código

class LinksParser(HTMLParser):
  def __init__(self):
    HTMLParser.__init__(self)
    self.recording = 0
    self.data = ''

  def handle_starttag(self, tag, attributes):
    if tag != 'span':
      return
    if self.recording:
      self.recording += 1
      return
    for name, value in attributes:
      if name == 'itemprop' and value == 'description':
        break
    else:
      return
    self.recording = 1

  def handle_endtag(self, tag):
    if tag == 'span' and self.recording:
      self.recording -= 1

  def handle_data(self, data):
    if self.recording:
      self.data += data

Eu também quero as tags html dentro da entrada, por exemplo

<span itemprop="description">
<h1>My First Heading</h1>
<p>My first <br/><br/>paragraph.</p>
</span>

quando fornecido como entrada, só me daria os dados sem tags. Existe algum método com o qual eu possa obter html inteiro entre as tags?

questionAnswers(2)

Perguntas populares

0 a resposta

Conclusão de código não funciona com arquivo remoto (com RSE)

0 a resposta

Rails named_scope herança?

0 a resposta

DIV esticar até a altura 100% em uma célula da tabela

0 a resposta

Show me a Simple Javascript onSubmit handler

0 a resposta

Perl expressão regular removendo substrings consecutivos duplicados em uma string

Você é muito ativo! É ótimo!

Obtenha o html sob uma tag usando o htmlparser python

questionAnswers(2)

yourAnswerToTheQuestion

Perguntas populares