Unicode w Pythonie - tylko UTF-16?
Byłem szczęśliwy w moim świecie Pythona, wiedząc, że robiłem wszystko w Unicode i kodowałem jako UTF-8, gdy potrzebowałem wyprowadzić coś do użytkownika. Potem wysłał mnie jeden z moich kolegówTen artykuł na UTF-8 i to mnie zdezorientowało.
Autor artykułu wskazuje, ile razy UCS-2, reprezentacja Unicode, której używa Python, jest synonimem UTF-16. Posunął się nawet do bezpośredniego powiedzenia, że Python używa UTF-16 do wewnętrznej reprezentacji ciągu.
Autor przyznaje również, że jest miłośnikiem Windows i deweloperem, i stwierdza, że sposób, w jaki MS radził sobie z kodowaniem znaków przez lata, doprowadził do tego, że ta grupa jest najbardziej zdezorientowana, więc może to tylko jego własne zamieszanie. Nie wiem...
Czy ktoś może wyjaśnić, jaki jest stan UTF-16 vs Unicode w Pythonie? Czy są synonimami, a jeśli nie, w jaki sposób?