Всегда ли символы в верхнем регистре utf8 имеют то же количество байтов, что и их строчные варианты?

Очевидно, это верно для латинского алфавита. Но я спрашиваю об этом в концептуальном смысле, для разных языков и спецификаций Unicode.

Практически это подходило для сравнения двух строк. Если вы уже знаете, что это не одно и то же число байтов - во всех языках - можете ли вы считать это достаточной гарантией того, что они не будут по-разному "заключать в кавычки" версии одной строки?

Ответы на вопрос(2)

Ваш ответ на вопрос