¿Opciones para el raspado de HTML? [cerrado]
Estoy pensando en intentarHermosa sopa, un paquete de Python para el raspado de HTML. ¿Hay otros paquetes de raspado de HTML que debería mirar? Python no es un requisito, en realidad también estoy interesado en escuchar sobre otros idiomas.
La historia hasta ahora:
PitónHermosa sopalxmlHTQLScrapyMecanizarRubíNokogiriHpricotMecanizarscrAPIscRUBYt!wombatWatir.REDPaquete de agilidad HTMLWatinPerlWWW :: MecanizarRaspador de webJavaTag SoupHtmlUnitWeb-HarvestJARVESTjsoupJericho HTML ParserJavaScriptsolicitudcheerioartoonodo-jinetephantomjsPHPGouttehtmlSQLPHP Simple HTML DOM ParserPHP Scraping con CURLScarletsQueryLa mayoría de ellosRaspador de pantalla