Gibt es eine Programmiersprache mit vollständiger und korrekter Unicode-Unterstützung?
Die meisten Programmiersprachen habenetwa Unterstützung für Unicode, aber alle haben mehr oder weniger dokumentierte Eckfälle, in denen die Dinge nicht richtig funktionieren.
Beispiele
Java reverse () in StringBuilder / StringBuffer funktionieren korrekt. Length (), charAt () usw. in String tun dies jedoch nicht, wenn ein Zeichen mehr als 16 Bit zum Codieren benötigt.
C #: Keine korrekte umgekehrte Methode gefunden. Länge und indizierter Zugriff liefern falsche Ergebnisse.
Perl: Gleiches Problem
PHP: Hat überhaupt keine Ahnung von Unicode, mbstring hat einige besser funktionierende Ersetzungen.
Ich frage mich, ob es eine Programmiersprache gibt, die vollständigen und korrekten Unicode-Support bietet. Welche Kompromisse mussten da gemacht werden, um so etwas zu erreichen?
Komplexere Algorithmen? Höherer Speicherverbrauch? Geringere Leistung?Wie wurde es intern implementiert?
Reihe von Ints, verknüpften Listen usw.Zusätzliche PufferungIch habe gesehen, dass sich in Python 3 in diesem Bereich einiges getan hat. Wie nah ist Python 3 jetzt an einer korrekten Implementierung?