Convertendo UTF-16 em UTF-8
Estou carregando uma string de um arquivo. Quando imprimo a sequência com:
print my_string
print binascii.hexlify(my_string)
Eu recebo:
2DF5
0032004400460035
Significando que esta sequência éUTF-16
. Eu gostaria de converter essa string paraUTF-8
para que o código acima produza esta saída:
2DF5
32444635
Eu tentei:
my_string.decode('utf-8')
Qual saída:
32004400460035
EDITAR:
Aqui está uma amostra rápida:
hello = 'hello'.encode('utf-16')
print hello
print binascii.hexlify(hello)
hello = hello[2:].decode('utf-8')
print hello
print binascii.hexlify(hello)
O que produz esta saída:
��hello
fffe680065006c006c006f00
hello
680065006c006c006f00
A produção esperada seria:
��hello
fffe680065006c006c006f00
hello
68656c6c6f