Принудительное кодирование из US-ASCII в UTF-8 (iconv)
Я пытаюсь перекодировать несколько файлов из US-ASCII в UTF-8.
Для этого я использую iconv:
iconv -f US-ASCII -t UTF-8 file.php > file-utf8.php
Дело в том, что мои оригинальные файлы имеют кодировку US-ASCII, что делает преобразование невозможным. Очевидно, это происходит потому, что ASCII является подмножеством UTF-8 ...
И цитирую:
There's no need for the textfile to appear otherwise until non-ascii characters are introduced
Правда. Если я введу не-ASCII-символ в файл и сохраню его, скажем, с помощью Eclipse, кодировка файла (кодировка) переключится на UTF-8.
В моем случае я бы хотелforce iconv to transcode the files to UTF-8 anyway, Есть ли в нем не-ASCII символы или нет.
Примечание: причина в том, что мой PHP-код (не ASCII-файлы ...) имеет дело с некоторой не-ASCII-строкой, что приводит к тому, что строки плохо интерпретируются (по-французски):
Il était une fois... l'homme série animée mythique d'Albert
Barillé (Procidis), 1ère
...
EDIT
US-ASCII
-- is -- a subset of UTF-8
(see Ned's answer below)
Meaning that US-ASCII
files are actually encoded in UTF-8
My problem came from somewhere else