Converter escape Unicode em texto hebraico

Question

Sep 22, 2018, 03:27 PM

hebrew python-3.x unicode-escapes utf-8 unicode

Converter escape Unicode em texto hebraico

Eu tenho o seguinte texto em um arquivo json:

"\u00d7\u0090\u00d7\u0097\u00d7\u0095\u00d7\u0096\u00d7\u00aa 
\u00d7\u00a4\u00d7\u0095\u00d7\u009c\u00d7\u0092"

que representa o texto "אחוזת פולג" em hebraico.

Não importa qual codificação / decodificação eu uso, eu não pareço acertar com o Python 3.

se, por exemplo, tentar:

text = "\u00d7\u0090\u00d7\u0097\u00d7\u0095\u00d7\u0096\u00d7\u00aa 
\u00d7\u00a4\u00d7\u0095\u00d7\u009c\u00d7\u0092".encode('unicode-escape')

print(text)

Eu recebo esse texto é:

b'\\xd7\\x90\\xd7\\x97\\xd7\\x95\\xd7\\x96\\xd7\\xaa \\xd7\\xa4\\xd7\\x95\\xd7\\x9c\\xd7\\x92'

que no bytecode équase o texto correto, se eu consegui removerapenas uma barra invertida e vira

b'\\xd7\\x90\\xd7\\x97\\xd7\\x95\\xd7\\x96\\xd7\\xaa \\xd7\\xa4\\xd7\\x95\\xd7\\x9c\\xd7\\x92'

para dentro

text = b'\xd7\x90\xd7\x97\xd7\x95\xd7\x96\xd7\xaa \xd7\xa4\xd7\x95\xd7\x9c\xd7\x92'

(observe como mudei barra dupla para barra única) e, em seguida,

text.decode('utf-8')

produziria o texto correto em hebraico.

mas estou lutando para fazer isso e não consegui criar um pedaço de código que faça isso por mim (e não manualmente, como acabei de mostrar ...)

qualquer ajuda muito apreciada ...

questionAnswers(1)

Perguntas populares

0 a resposta

groovy script classpath

0 a resposta

Classe .NET SqlConnection, pool de conexão e lógica de reconexão

0 a resposta

Caracteres ilegais no caminho ao carregar uma string com XDocument

0 a resposta

Resolvendo conflito de versões entre java e javac no Ubuntu

0 a resposta

Dividir seqüências de caracteres em palavras com delimitadores de limite de várias palavras

Você é muito ativo! É ótimo!

Converter escape Unicode em texto hebraico

questionAnswers(1)

yourAnswerToTheQuestion

Perguntas populares