Parsing HTML com Python 2.7 - HTMLParser, SGMLParser ou Beautiful Soup?

Question

Jun 27, 2011, 04:11 PM

python html beautifulsoup parsing html-parsing

Parsing HTML com Python 2.7 - HTMLParser, SGMLParser ou Beautiful Soup?

Eu quero fazer algumas capturas de tela com o Python 2.7 e não tenho contexto para as diferenças entreHTMLParser, SGMLParser, ou sopa bonita.

Estão todos tentando resolver o mesmo problema ou existem por diferentes razões? Qual é a mais simples, qual é a mais robusta e qual (se houver) é a opção padrão?

Além disso, informe-me se eu ignorei uma opção significativ

Editar Devo mencionar que não sou particularmente experiente em análise de HTML e estou particularmente interessado em saber o que me fará avançar mais rapidamente, com o objetivo de analisar HTML em um site específic