Kodierung von US-ASCII nach UTF-8 erzwingen (iconv)
Ich versuche, eine Reihe von Dateien von US-ASCII nach UTF-8 umzucodieren.
Dafür benutze ich iconv:
iconv -f US-ASCII -t UTF-8 file.php > file-utf8.php
Meine Originaldateien sind US-ASCII-codiert, sodass die Konvertierung nicht stattfinden kann. Anscheinend tritt es auf, weil ASCII eine Teilmenge von UTF-8 ist ...
Und zitieren:
Es ist nicht erforderlich, dass die Textdatei anders angezeigt wird, bis Nicht-ASCII-Zeichen eingeführt werden
Wahr. Wenn ich ein Nicht-ASCII-Zeichen in die Datei einführe und es speichere, sagen wir mit Eclipse, wird die Dateicodierung (Zeichensatz) auf UTF-8 umgestellt.
In meinem Fall würde ich gerneerzwinge iconv, die Dateien trotzdem nach UTF-8 zu transkodieren. Gibt an, ob Nicht-ASCII-Zeichen enthalten sind oder nicht.
Hinweis: Der Grund dafür ist, dass mein PHP-Code (Nicht-ASCII-Dateien ...) sich mit Nicht-ASCII-Zeichenfolgen befasst, was dazu führt, dass die Zeichenfolgen nicht richtig interpretiert werden (Französisch):
Es ist ein Vergnügen, die Geschichte von Albert zu erzählen
Barillé (Procidis), 1ère
...
BEARBEITEN
US-ASCII
-ist -- eine Teilmenge vonUTF-8
(sehenNeds Antwort unten)Bedeutet, dassUS-ASCII
Dateiensind tatsächlich in codiertUTF-8
Mein Problem kam von woanders her