регулярное выражение python с вопросом utf8
Я получил файл, который включает в себя много строк простого текста UTF-8. Например, ниже, это китайский.
<code>PROCESS:类型:关爱积分[NOTIFY] 交易号:2012022900000109 订单号:W12022910079166 交易金额:0.01元 交易状态:true 2012-2-29 10:13:08 </code>
Сам файл был сохранен в формате utf-8. имя файла xx.txt
вот мой код на python, env - это python2.7
<code>#coding: utf-8 import re pattern = re.compile(r'交易金额:(\d+)元') for line in open('xx.txt'): match = pattern.match(line.decode('utf-8')) if match: print match.group() </code>
Проблема здесь в том, что я не получил никаких результатов.
Я хочу получить десятичную строку из交易金额:0.01元
здесь, который0.01
.
Почему этот код не работает? Кто-нибудь может мне это объяснить, я понятия не имею.