python - проблемы с регулярным выражением и юникодом
Привет, у меня есть проблема в Python. Я пытаюсь объяснить мою проблему на примере.
У меня есть эта строка:
>>> string = 'ÐÑÒÓÔÕÖ×ØÙÚÛÜÝÞßàáâãäåæçèéêëìíîïðñòóôõö÷øùúûüýþÿÀÁÂÃ'
>>> print string
ÐÑÒÓÔÕÖ×ØÙÚÛÜÝÞßàáâãäåæçèéêëìíîïðñòóôõö÷øùúûüýþÿÀÁÂÃ
и я хочу, например, заменить символы, отличные от С, М, Я с ""
я пытался:
>>> rePat = re.compile('[^ÑÃï]',re.UNICODE)
>>> print rePat.sub("",string)
�Ñ�����������������������������ï�������������������Ã
Я получил это , Я думаю, что этоЭто происходит потому, что символы этого типа в python представлены двумя позициями в векторе: например, \ xc3 \ x91 = Ñ, Для этого, когда я делаю реголярное выражение, все \ xc3 не подставляются. Как я могу сделать этот тип саба ?????
Спасибо франко