regulärer Python-Ausdruck mit utf8-Problem
Ich habe eine Datei erhalten, die viele Zeilen einfachen utf-8-Text enthält. Wie unten, nebenbei bemerkt, ist es chinesisch.
<code>PROCESS:类型:关爱积分[NOTIFY] 交易号:2012022900000109 订单号:W12022910079166 交易金额:0.01元 交易状态:true 2012-2-29 10:13:08 </code>
Die Datei selbst wurde im utf-8-Format gespeichert. Dateiname ist xx.txt
hier ist mein python code, env ist python2.7
<code>#coding: utf-8 import re pattern = re.compile(r'交易金额:(\d+)元') for line in open('xx.txt'): match = pattern.match(line.decode('utf-8')) if match: print match.group() </code>
Das Problem hierbei ist, dass ich keine Ergebnisse erzielt habe.
Ich möchte die Dezimalzeichenfolge von bekommen交易金额:0.01元
hier, was ist0.01
.
Warum funktioniert dieser Code nicht? Kann mir jemand erklären, ich habe überhaupt keine Ahnung.