Результаты поиска по запросу "byte-order-mark"

3 ответа

создать строку UTF-8 с спецификацией

Я использую функцию MD5 и Base64 Encoding для генерации секрета пользователя (используется для входа на уровень данных используемого API)Я сделал код вJavasc...

3 ответа

использование:

я есть XML с кодировкой UTF8. И этот файл содержит спецификацию начала файла. Поэтому во время синтаксического анализа я сталкиваюсь с org.xml.sax.SAXParseException: содержимое не разрешено в прологе. Я не могу удалить эти 3 байта из файлов. Я не ...

3 ответа

Если в файле есть не только байты <= 0x0F (после спецификации), чтобы убедиться, что он правильно закодирован в UTF-8, вам нужно будет проверить правильность последовательностей и - даже если все последовательности действительны - проверить также, если каждый кодовая точка из последовательности использует самую короткую из возможных последовательностей и также проверяет, не существует ли кодовая точка, которая соответствует высокому или низкому суррогату. Также проверьте, не превышает ли максимальное число байтов последовательности 4, а самая высокая кодовая точка равна 0x10FFFF. Наивысшая кодовая точка ограничивает также биты полезной нагрузки начального байта не более 0x4, а полезная нагрузка первого следующего байта не выше 0xF. Если все упомянутые проверки пройдены успешно, ваша спецификация UTF-8 говорит правду.

ользую фид данных, который недавно добавил заголовок спецификации Unicode (U + FEFF), и моя задача rake теперь испорчена им. Я могу пропустить первые 3 байта сfile.gets[3..-1] но есть ли более элегантный способ чтения файлов в Ruby, который ...

ТОП публикаций

4 ответа

Добавление спецификации UTF-8 в строку / Blob

4 ответа

Запуск сценария SQL через psql дает синтаксические ошибки, которые не возникают в PgAdmin

У меня есть следующий скрипт для создания таблицы:

4 ответа

XmlReader прерывается на спецификации UTF-8

4 ответа

@Victor Я обновил свой ответ.

служебный метод или константу в Java, которая вернет мне байты, которые соответствуют метке порядка следования байтов для кодирования, но я не могу найти ни одного. Есть один? Я действительно хотел бы сделать что-то вроде: byte[] bom = ...

4 ответа

Запись в файл UTF-8 на Python

Я действительно запутался сcodecs.open function, Когда я делаю: file = codecs.open("temp", "w", "utf-8") file.write(codecs.BOM_UTF8) file.close()Это дает мне ошибку UnicodeDecodeError: кодек «ascii» не может декодировать байт 0xef в позиции ...

4 ответа

Добавление спецификации UTF-8 в строку / Blob

Мне нужно добавить метку порядка байтов UTF-8 к сгенерированным текстовым данным на стороне клиента. Как мне это сделать? С помощьюnew Blob(['\xEF\xBB\xBF' + content]) доходность'"my data"', конечно. Ни один не сделал'\uBBEF\x22BF' работать ...

5 ответов

Использование awk для удаления метки порядка байтов

Как бы