Результаты поиска по запросу "multibyte"

6 ответов

@xavier: как это реализовать?

самый быстрый способ реализовать следующую логику: def xor(data, key): l = len(key) buff = "" for i in range(0, len(data)): buff += chr(ord(data[i]) ^ ord(key[i % l])) return buffВ моем случаеключ является 20-байтовым дайджестом sha1, иданные ...

2 ответа

Также следует решить вопрос (у меня это сработало).

аюсь записать данные в файл Excel, который содержит японские символы. Я использую codec.open () для получения данных, и это, кажется, работает нормально, но я сталкиваюсь с этой ошибкой, когда пытаюсь записать данные: UnicodeEncodeError: 'ascii' ...

9 ответов

Что такое многобайтовый набор символов?

Относится ли термин многобайтовый к кодировке, чьи символы могут - но не обязательно должны быть - шире, чем 1 байт (например, UTF-8), или он относится к наборам символов, которые в любом случае шире, чем 1 байт (например, UTF)? -16) Другими ...

ТОП публикаций

2 ответа

Как обрабатывать многобайтовые строки в Python

В PHP есть многобайтовые строковые функции для обработки многобайтовой строки (например, CJK-скрипт). Например, я хочу посчитать, сколько букв в многобайтовой строке, используяlen функция в Python, но она возвращает неточный результат (т.е. ...

1 ответ

Преобразовать символы Юникода выше 127 в десятичные [дубликаты]

Возможный дубликат: Как преобразовать текст в кодировку Unicode, например, с помощью php? [https://stackoverflow.com/questions/10100617/how-to-convert-text-to-unicode-code-point-like-u0054-u0068-u0069-u0073-using-p] Я пытаюсь преобразовать все ...

2 ответа

PHP mb_substr () не работает правильно?

Этот код print mb_substr('éxxx', 0, 1); печатает пустое место :( Предполагается напечатать первый символ,é, Это похоже на работу, однако: print mb_substr('éxxx', 0, 2); Но это не правильно, потому что (0, 2) означает 2 символа ...

6 ответов

Как обнаружить и повторить последний гласный в слове?

$word = "Acrobat" (or Apple, Tea etc.)Как я могу обнаружить и повторить последний гласный данного слова с php? Я пытался использовать функцию preg_match, Google часами, но не смог найти правильного решения. В строке могут быть многобайтовые ...

3 ответа

Как работает UTF-8 «кодирование с переменной шириной»?

В стандарте Unicode достаточно кодов, чтобы хранить их все 4 байта. Вот что делает кодировка UTF-32. Тем не менее, кодировка UTF-8 каким-то образом сжимает их в гораздо меньшие пространства с помощью так называемого «кодирования с переменной ...

1 ответ

Печать строк UTF-8 с использованием широких и многобайтовых строковых литералов printf

В таких операторах, где оба они вводятся в исходный код с одинаковой кодировкой (UTF-8) и локаль настроена правильно, есть ли практическая разница между ними? printf("ο Δικαιοπολις εν αγρω εστιν\n"); printf("%ls", L"ο Δικαιοπολις εν ...

2 ответа

Взаимодействует ли многобайтовый символ с символом конца строки в регулярном выражении?

С этим регулярным выражением: regex1 = /\z/следующие строки соответствуют: "hello" =~ regex1 # => 5 "こんにちは" =~ regex1 # => 5но с этими регулярными выражениями: regex2 = /#$/?\z/ regex3 = /\n?\z/они показывают разницу: "hello" =~ regex2 # => 5 ...