expressão regular python com problema utf8
Eu tenho um arquivo que inclui muitas linhas de texto utf-8 simples. Tal como abaixo, a propósito, é chinês.
<code>PROCESS:类型:关爱积分[NOTIFY] 交易号:2012022900000109 订单号:W12022910079166 交易金额:0.01元 交易状态:true 2012-2-29 10:13:08 </code>
O arquivo em si foi salvo no formato utf-8. nome do arquivo é xx.txt
aqui está o meu código python, env é python2.7
<code>#coding: utf-8 import re pattern = re.compile(r'交易金额:(\d+)元') for line in open('xx.txt'): match = pattern.match(line.decode('utf-8')) if match: print match.group() </code>
A coisa problemática aqui é que não tenho resultados.
Eu quero pegar a string decimal de交易金额:0.01元
aqui dentro, que é0.01
.
Por que esse código não funciona? Alguém pode explicar isso para mim, eu não tenho idéia alguma.