Opções para raspagem de HTML? [fechadas]
Estou pensando em tentarSopa bonita, um pacote Python para raspagem de HTML. Existem outros pacotes de raspagem de HTML que eu deveria estar olhando? Python não é um requisito, estou realmente interessado em ouvir sobre outras linguagens também.
A história até agora:
PitãoSopa bonitalxmlHTQLScrapyMecanizarRubiNokogiriHpricotMecanizarscrAPIscRUBYt!wombatWatir.INTERNETPacote de agilidade HTMLWatiNPerlWWW :: MecanizarRaspador da WebJavaSopa de etiquetasHtmlUnitColheita na WebjARVESTjsoupAnalisador de HTML de JericóJavascriptsolicitaçãocheerioartoocavaleiro do nóphantomjsPHPGouttehtmlSQLAnalisador DOM HTML Simples em PHPRaspagem PHP com CURLScarletsQueryA maioria delesRaspador de tela