Converter escape Unicode em texto hebraico
Eu tenho o seguinte texto em um arquivo json:
"\u00d7\u0090\u00d7\u0097\u00d7\u0095\u00d7\u0096\u00d7\u00aa
\u00d7\u00a4\u00d7\u0095\u00d7\u009c\u00d7\u0092"
que representa o texto "אחוזת פולג" em hebraico.
Não importa qual codificação / decodificação eu uso, eu não pareço acertar com o Python 3.
se, por exemplo, tentar:
text = "\u00d7\u0090\u00d7\u0097\u00d7\u0095\u00d7\u0096\u00d7\u00aa
\u00d7\u00a4\u00d7\u0095\u00d7\u009c\u00d7\u0092".encode('unicode-escape')
print(text)
Eu recebo esse texto é:
b'\\xd7\\x90\\xd7\\x97\\xd7\\x95\\xd7\\x96\\xd7\\xaa \\xd7\\xa4\\xd7\\x95\\xd7\\x9c\\xd7\\x92'
que no bytecode équase o texto correto, se eu consegui removerapenas uma barra invertida e vira
b'\\xd7\\x90\\xd7\\x97\\xd7\\x95\\xd7\\x96\\xd7\\xaa \\xd7\\xa4\\xd7\\x95\\xd7\\x9c\\xd7\\x92'
para dentro
text = b'\xd7\x90\xd7\x97\xd7\x95\xd7\x96\xd7\xaa \xd7\xa4\xd7\x95\xd7\x9c\xd7\x92'
(observe como mudei barra dupla para barra única) e, em seguida,
text.decode('utf-8')
produziria o texto correto em hebraico.
mas estou lutando para fazer isso e não consegui criar um pedaço de código que faça isso por mim (e não manualmente, como acabei de mostrar ...)
qualquer ajuda muito apreciada ...