Encuentra comentarios específicos en código HTML usando python
No puedo encontrar un comentario específico en Python, en el ejemplo<!-- why -->
. Mi principal razón es encontrar todos los enlaces dentro de 2 comentarios específicos. Algo como un analizador. Probé esto conBeautifulsoup
:
import urllib
over=urlopen("www.gamespot.com").read()
soup = BeautifulSoup(over)
print soup.find("<!--why-->")
Pero no funciona. Creo que podría tener que usarregex
y noBeautifulsoup
.
Por favor ayuda.
EJEMPLO: tenemos código HTML como este
<!--why-->
www.godaddy.com
<p> nice one</p>
www.wwf.com
<!-- why not-->
EDITAR: Entre los 2 comentarios, pueden existir otras cosas, como etiquetas.
Y necesito almacenar todos los enlaces.