Набор символов Специальные символы

Is iso-8859-1 a proper subset of utf-8? What about iso-8859-n? What about windows-1252?

Если ответ отрицательный на любой из вышеперечисленных, каковы непересекающиеся символы? Я тестирую некоторую логику, которая обнаруживает кодировки, и хочу написать тесты, чтобы убедиться, что обнаружение работает правильно.

Ответы на вопрос(2)

Решение Вопроса

Is iso-8859-1 a proper subset of utf-8?

character reportoire из ISO-8859-1 (первые 256 символов Unicode) является надлежащим подмножеством UTF-8 (каждый символ Unicode).

Тем не менеесимволы от U + 0080 до U + 00FF являютсяencoded по-разному в двух кодировках.

ISO-8859-1 assigns each of these characters a single byte from 80 to FF. UTF-8 encodes the same characters as two-byte sequences C2 80 to C3 BF.

What about iso-8859-n?

Это 15 различных кодировок, которые содержат в общей сложности 614 различных символов. Некоторые из этих символов встречаются в нескольких «частях» ИСО 8859, а некоторые нет. Вы должны быть более конкретными.

Я вижу, что ваш вопрос помечен ISO-8859-2. Символы, которые находятся в -2, а не -1 в:

Ă㥹ĆćČčĎďĐđĘęĚěĹ弾ŁłŃńŇňŐőŔŕŘřŚśŞşŠšŢţŤťŮůŰűŹźŻżŽžˇ˘˙˛˝

What about windows-1252?

Windows-1252 аналогична ISO-8859-1 за исключением того, что она заменяет редко используемые управляющие символы в диапазоне 0x80-0x9F печатными символами. Символы, которые есть в windows-1252, но не в ISO-8859-1:

ŒœŠšŸŽžƒˆ˜–—‘’‚“”„†‡•…‰‹›€™

 Sean Jezewski05 апр. 2012 г., 21:48
Ааа .. Я посмотрел это. Поскольку UTF-8 может представлять символы в виде нескольких байтов, он может выражать весь повтор Unicode. Это имеет смысл сейчас.
 Sean Jezewski05 апр. 2012 г., 21:27
То есть, вы говорите, что репертуар iso-8859-1 является правильным подмножеством репертуара utf-8? Я полагаю, что. В чем я не уверен, так это в том, что репертуар utf-8 равен репетирую unicode. Я думал, что цель utf-16 / utf-32 состоит в том, чтобы иметь возможность кодировать больше / все символы Unicode соответственно.

Юникод является надмножеством всех этих наборов символов, и в значительной степени всех установленных наборов символов там. Вы можете найти список отображений всех этих наборов символов в кодовые точки Unicode здесь:http://unicode.org/Public/MAPPINGS/.

Ваш ответ на вопрос