Python expresión regular con problema utf8
Conseguí un archivo que incluye muchas líneas de texto simple utf-8. Como el de abajo, por cierto, es chino.
<code>PROCESS:类型:关爱积分[NOTIFY] 交易号:2012022900000109 订单号:W12022910079166 交易金额:0.01元 交易状态:true 2012-2-29 10:13:08 </code>
El archivo en sí fue guardado en formato utf-8. nombre de archivo es xx.txt
Aquí está mi código de python, env es python2.7
<code>#coding: utf-8 import re pattern = re.compile(r'交易金额:(\d+)元') for line in open('xx.txt'): match = pattern.match(line.decode('utf-8')) if match: print match.group() </code>
Lo problemático aquí es que no tengo resultados.
Quiero obtener la cadena decimal de交易金额:0.01元
, aquí, que es0.01
.
¿Por qué no funciona este código? Alguien me lo puede explicar, no tengo ninguna pista en absoluto.