Encontre comentários específicos em código HTML usando python
Eu não consigo encontrar um comentário específico em python, por exemplo, o<!-- why -->
. Meu principal motivo é encontrar todos os links dentro de dois comentários específicos. Algo parecido com um analisador. Eu tentei isso comBeautifulsoup
:
import urllib
over=urlopen("www.gamespot.com").read()
soup = BeautifulSoup(over)
print soup.find("<!--why-->")
Mas isso não funciona. Acho que posso ter que usarregex
e nãoBeautifulsoup
.
Por favor ajude.
EXEMPLO: temos código HTML como este
<!--why-->
www.godaddy.com
<p> nice one</p>
www.wwf.com
<!-- why not-->
EDIT: Entre os dois comentários, outras coisas, como tags, podem existir.
E preciso armazenar todos os links.