Usando unicode (caracteres hebreos) con expresión regular
Escribí un script que encuentra expresiones en la página web:
import sre, urllib2, sys, BaseHTTPServer
# -*- coding: utf-8 -*-
address = sys.argv[1]
web_handle = urllib2.urlopen(address)
website_text = website_handle.read()
matches = sre.findall(u"עברית", website_text)
for item in matches:
print iten
Este script funciona si uso una expresión regular "regular" (sin caracteres hebreos) y no coincide con nada si los uso. ¿Qué estoy haciendo mal?
editar ejemplo: url =https://en.wikipedia.org/wiki/Category:Countries