Gibt es eine Programmiersprache mit vollständiger und korrekter Unicode-Unterstützung?

Question

Jul 24, 2010, 03:36 PM

programming-languages language-agnostic encoding string unicode

Gibt es eine Programmiersprache mit vollständiger und korrekter Unicode-Unterstützung?

Die meisten Programmiersprachen habenetwa Unterstützung für Unicode, aber alle haben mehr oder weniger dokumentierte Eckfälle, in denen die Dinge nicht richtig funktionieren.

Beispiele

Java reverse () in StringBuilder / StringBuffer funktionieren korrekt. Length (), charAt () usw. in String tun dies jedoch nicht, wenn ein Zeichen mehr als 16 Bit zum Codieren benötigt.

C #: Keine korrekte umgekehrte Methode gefunden. Länge und indizierter Zugriff liefern falsche Ergebnisse.

Perl: Gleiches Problem

PHP: Hat überhaupt keine Ahnung von Unicode, mbstring hat einige besser funktionierende Ersetzungen.

Ich frage mich, ob es eine Programmiersprache gibt, die vollständigen und korrekten Unicode-Support bietet. Welche Kompromisse mussten da gemacht werden, um so etwas zu erreichen?

Komplexere Algorithmen? Höherer Speicherverbrauch? Geringere Leistung?

Wie wurde es intern implementiert?

Reihe von Ints, verknüpften Listen usw.Zusätzliche Pufferung

Ich habe gesehen, dass sich in Python 3 in diesem Bereich einiges getan hat. Wie nah ist Python 3 jetzt an einer korrekten Implementierung?