Como o unicode é representado internamente no Python?
Como a string Unicode é representada literalmente na memória do Python?
Por exemplo, eu poderia visualizar'abc'
como seus bytes ASCII equivalentes na memória. Inteiro poderia ser considerado a representação de elogio do 2. Contudou'\u2049'
, mesmo que esteja representado emUTF-8
Como'\xe2\x81\x89'
- 3 bytes de comprimento, como visualizo o literalu'\u2049'
codepoint na memória?
Existe uma maneira específica de armazená-lo na memória? O Python 2 e o Python 3 o tratam de maneira diferente?
Algumas perguntas relacionadas a qualquer pessoa curiosa:
1)Como essas strings são representadas internamente no interpretador Python? Eu não entendo