Использование юникода (ивритские символы) с регулярным выражением
Я написал скрипт, который находит выражения на веб-странице:
import sre, urllib2, sys, BaseHTTPServer
# -*- coding: utf-8 -*-
address = sys.argv[1]
web_handle = urllib2.urlopen(address)
website_text = website_handle.read()
matches = sre.findall(u"עברית", website_text)
for item in matches:
print iten
Этот сценарий работает, если я использую «регулярное» регулярное выражение (без ивритских символов) и ничего не соответствует, если я использую их. Что я делаю неправильно?
редактировать пример: url =https://en.wikipedia.org/wiki/Category:Countries