Результаты поиска по запросу "byte-order-mark"

7 ответов

Подпись спецификации UTF-8 в файлах PHP

Я писал некоторые прокомментированные классы PHP и наткнулся на проблему. Мое имя (для тега @author) заканчивается

4 ответа

Запуск сценария SQL через psql дает синтаксические ошибки, которые не возникают в PgAdmin

У меня есть следующий скрипт для создания таблицы:

20 ответов

What's the difference between UTF-8 and UTF-8 without BOM?

ТОП публикаций

8 ответов

Порядок следования байтов затрудняет чтение файлов в Java

Я пытаюсь читать файлы CSV, используя Java. Некоторые из файлов могут иметь метку порядка байтов в начале, но не все. При наличии порядок байтов читается вме...

1 ответ

Спецификация на странице PHP, автоматически сгенерированная Wordpress

Я администрирую два разных блога. Они оба WordPress 2.8.6 (поэтому они имеют одинаковый исходный код, кроме плагинов), но они расположены на двух разных хост...

4 ответа

Запись в файл UTF-8 на Python

Я действительно запутался сcodecs.open function, Когда я делаю: file = codecs.open("temp", "w", "utf-8") file.write(codecs.BOM_UTF8) file.close()Это дает мне ошибку UnicodeDecodeError: кодек «ascii» не может декодировать байт 0xef в позиции ...

4 ответа

@Victor Я обновил свой ответ.

служебный метод или константу в Java, которая вернет мне байты, которые соответствуют метке порядка следования байтов для кодирования, но я не могу найти ни одного. Есть один? Я действительно хотел бы сделать что-то вроде: byte[] bom = ...

3 ответа

Если в файле есть не только байты <= 0x0F (после спецификации), чтобы убедиться, что он правильно закодирован в UTF-8, вам нужно будет проверить правильность последовательностей и - даже если все последовательности действительны - проверить также, если каждый кодовая точка из последовательности использует самую короткую из возможных последовательностей и также проверяет, не существует ли кодовая точка, которая соответствует высокому или низкому суррогату. Также проверьте, не превышает ли максимальное число байтов последовательности 4, а самая высокая кодовая точка равна 0x10FFFF. Наивысшая кодовая точка ограничивает также биты полезной нагрузки начального байта не более 0x4, а полезная нагрузка первого следующего байта не выше 0xF. Если все упомянутые проверки пройдены успешно, ваша спецификация UTF-8 говорит правду.

ользую фид данных, который недавно добавил заголовок спецификации Unicode (U + FEFF), и моя задача rake теперь испорчена им. Я могу пропустить первые 3 байта сfile.gets[3..-1] но есть ли более элегантный способ чтения файлов в Ruby, который ...

2 ответа

XML - данные на корневом уровне недействительны

У меня есть XSD-файл, который закодирован в UTF-8, и любой текстовый редактор, через который я его запускаю, не показывает никаких символов в начале файла, н...

6 ответов

PHP Включить функцию вывода неизвестного символа