Parsing HTML com Python 2.7 - HTMLParser, SGMLParser ou Beautiful Soup?
Eu quero fazer algumas capturas de tela com o Python 2.7 e não tenho contexto para as diferenças entreHTMLParser
, SGMLParser
, ou sopa bonita.
Estão todos tentando resolver o mesmo problema ou existem por diferentes razões? Qual é a mais simples, qual é a mais robusta e qual (se houver) é a opção padrão?
Além disso, informe-me se eu ignorei uma opção significativ
Editar Devo mencionar que não sou particularmente experiente em análise de HTML e estou particularmente interessado em saber o que me fará avançar mais rapidamente, com o objetivo de analisar HTML em um site específic