Unicode em Python - apenas UTF-16?
Eu estava feliz em meu mundo Python, sabendo que estava fazendo tudo em Unicode e codificando como UTF-8 quando precisava enviar algo para um usuário. Então, um dos meus colegas me enviouEste artigo em UTF-8 e isso me confundiu.
O autor do artigo indica um número de vezes que o UCS-2, a representação Unicode usada pelo Python, é sinônimo de UTF-16. Ele chega até a dizer diretamente que o Python usa o UTF-16 para representação de string interna.
O autor também admite ser um amante e desenvolvedor do Windows e afirma que a forma como o MS lidou com as codificações de caracteres ao longo dos anos fez com que o grupo fosse o mais confuso, então talvez seja apenas sua própria confusão. Eu não sei...
Alguém pode por favor explicar o que é o estado de UTF-16 vs Unicode em Python? Eles são sinônimos e se não, de que maneira?