Convertir escape Unicode a texto hebreo
Tengo el siguiente texto en un archivo json:
"\u00d7\u0090\u00d7\u0097\u00d7\u0095\u00d7\u0096\u00d7\u00aa
\u00d7\u00a4\u00d7\u0095\u00d7\u009c\u00d7\u0092"
que representa el texto "אחוזת פולג" en hebreo.
No importa qué codificación / decodificación use, parece que no lo hago bien con Python 3.
si, por ejemplo, lo intento:
text = "\u00d7\u0090\u00d7\u0097\u00d7\u0095\u00d7\u0096\u00d7\u00aa
\u00d7\u00a4\u00d7\u0095\u00d7\u009c\u00d7\u0092".encode('unicode-escape')
print(text)
recibo ese texto es:
b'\\xd7\\x90\\xd7\\x97\\xd7\\x95\\xd7\\x96\\xd7\\xaa \\xd7\\xa4\\xd7\\x95\\xd7\\x9c\\xd7\\x92'
que en bytecode escas el texto correcto, si pude eliminar solo una barra invertida y turn
b'\\xd7\\x90\\xd7\\x97\\xd7\\x95\\xd7\\x96\\xd7\\xaa \\xd7\\xa4\\xd7\\x95\\xd7\\x9c\\xd7\\x92'
dentr
text = b'\xd7\x90\xd7\x97\xd7\x95\xd7\x96\xd7\xaa \xd7\xa4\xd7\x95\xd7\x9c\xd7\x92'
(tenga en cuenta cómo cambié la barra doble a barra simple) y luego
text.decode('utf-8')
produciría el texto correcto en hebreo.
pero estoy luchando por hacerlo y no pude crear un código que lo haga por mí (y no manualmente como acabo de mostrar ...)
cualquier ayuda muy apreciada ...