Kodierung von US-ASCII nach UTF-8 erzwingen (iconv)

Ich versuche, eine Reihe von Dateien von US-ASCII nach UTF-8 umzucodieren.

Dafür benutze ich iconv:

iconv -f US-ASCII -t UTF-8 file.php > file-utf8.php

Meine Originaldateien sind US-ASCII-codiert, sodass die Konvertierung nicht stattfinden kann. Anscheinend tritt es auf, weil ASCII eine Teilmenge von UTF-8 ist ...

http://www.linuxquestions.org/questions/linux-software-2/iconv-us-ascii-to-utf-8-or-iso-8859-15-a-705054/

Und zitieren:

Es ist nicht erforderlich, dass die Textdatei anders angezeigt wird, bis Nicht-ASCII-Zeichen eingeführt werden

Wahr. Wenn ich ein Nicht-ASCII-Zeichen in die Datei einführe und es speichere, sagen wir mit Eclipse, wird die Dateicodierung (Zeichensatz) auf UTF-8 umgestellt.

In meinem Fall würde ich gerneerzwinge iconv, die Dateien trotzdem nach UTF-8 zu transkodieren. Gibt an, ob Nicht-ASCII-Zeichen enthalten sind oder nicht.

Hinweis: Der Grund dafür ist, dass mein PHP-Code (Nicht-ASCII-Dateien ...) sich mit Nicht-ASCII-Zeichenfolgen befasst, was dazu führt, dass die Zeichenfolgen nicht richtig interpretiert werden (Französisch):

Es ist ein Vergnügen, die Geschichte von Albert zu erzählen

Barillé (Procidis), 1ère

...

BEARBEITEN

US-ASCII -ist -- eine Teilmenge vonUTF-8 (sehenNeds Antwort unten)Bedeutet, dassUS-ASCII Dateiensind tatsächlich in codiertUTF-8Mein Problem kam von woanders her

Antworten auf die Frage(8)

Ihre Antwort auf die Frage