Como o unicode é representado internamente no Python?

Question

Sep 27, 2014, 11:28 PM

Como o unicode é representado internamente no Python?

Como a string Unicode é representada literalmente na memória do Python?

Por exemplo, eu poderia visualizar'abc' como seus bytes ASCII equivalentes na memória. Inteiro poderia ser considerado a representação de elogio do 2. Contudou'\u2049', mesmo que esteja representado emUTF-8 Como'\xe2\x81\x89' - 3 bytes de comprimento, como visualizo o literalu'\u2049' codepoint na memória?

Existe uma maneira específica de armazená-lo na memória? O Python 2 e o Python 3 o tratam de maneira diferente?

Algumas perguntas relacionadas a qualquer pessoa curiosa:

1)Como essas strings são representadas internamente no interpretador Python? Eu não entendo

2)O que é representação interna de string no Python 3.x