Результаты поиска по запросу "unicode"

13 ответов

«8-битные последовательности»…? Возможно, хотелось бы уточнить это более точно ...

шал противоречивые мнения от людей - в соответствии сВикипедия UTF-8 [http://en.wikipedia.org/wiki/UTF-8]стр. Это одно и то же, не так ли? Может кто-нибудь уточнить?

1 ответ

@DavidJames большое спасибо! Какая отличная статья. Я сообщил JEG о том, что сайт не работает. Он такой замечательный ведущий на подкасте ruby ​​rogues. Не могу поверить, что никогда раньше не посещал его блог, хотя, если честно, я занимаюсь рубином чуть меньше года :)

е знаем "волшебный" # encoding: utf-8линия. Но я видел несколько других альтернативных обозначений, некоторые из которых довольно дикие. Вы знаете или используете какой-либо из них? Есть ли более общее правило, что является ...

2 ответа

Таким образом, вы делаете что-то похожее на:

нальное название: "Помогите мне понять эту странную идиому Python?sys.stdout = codecs.getwriter('utf-8')(sys.stdout)" Я все время использую эту идиому для печати стандартного набора содержимого в utf-8 в Python 2. *: sys.stdout = ...

ТОП публикаций

4 ответа

 делает) и связать имя поддиапазона с каждой кодовой точкой.

аюсь найти ресурс, который можно использовать для подключения языков (или, скорее, сценариев) к блокам символов Юникода. Такой ресурс будет использоваться для поиска таких вопросов, как "Какие блоки Unicode используются на французском языке?" или ...

1 ответ

Если у вас слишком много специальных символов, вы должны преобразовать их в multi-char. 1. Старайтесь не находить «aa» в последовательности «ba ab», используйте какой-нибудь префикс, например «@ ba @ ab». 2. Старайтесь не находить "@a" в "@ab", используйте токены фиксированной длины, скажем, 2.

я есть таблица MySQL с двумя столбцами, оба с разбором utf8_unicode_ci. Он содержит следующие строки. За исключением ASCII, второе поле также содержит кодовые точки Unicode, такие как U + 02C8 (ВЕРТИКАЛЬНАЯ ВЕРТИКАЛЬНАЯ ПИСЬМА ИЗМЕНЕННОГО ПИСЬМА) ...

1 ответ

Кроме того, вы можете отобразить несколько байтов файла, переведенного в Unicode из всех кодировок, чтобы быстро увидеть, какой из них подходит для вашего файла.

самый быстрый и простой инструмент или метод для преобразования текстовых файлов между наборами символов? В частности, мне нужно конвертировать из UTF-8 в ISO-8859-15 и наоборот. Все идет: одна строка на вашем любимом языке сценариев, ...

3 ответа

Имена файлов с японскими символами превращаются в мусор при записи в zip-файл с использованием java.util.zip. *

У меня есть каталог с именем, содержащим японские символы, и мне нужно использовать утилиты zip в java.util.zip, чтобы записать его в zip-файл. Запись zip-файла завершается успешно, но когда я открываю полученный zip-файл с помощью встроенной в ...

3 ответа

python-re: Как мне сопоставить альфа-символ

Как я могу сопоставить альфа-символ с регулярным выражением. Я хочу персонаж, который находится в\w но не в\d, Я хочу, чтобы он был совместим с Unicode, поэтому я не могу использовать[a-zA-Z].

2 ответа

Возможно, что терминал Python использует ASCII по умолчанию, и есть символ, который выходит за пределы диапазона.

я назначу переменные литерала Unicode переменной, я могу прочитать ее значение: >>> s = u'\u0421\u043e\u043e\u0431\u0449\u0435\u043d\u0438\u0435 \u043e\u0442\u043f\u0440\u0430\u0432\u043b\u0435\u043d\u043e' >>> ...

1 ответ

Алгоритмы переноса слов для японского языка

В недавнем веб-приложении, которое я создал, я был приятно удивлен, когда один из наших пользователей решил использовать его для создания чего-то полностью на японском языке. Однако текст был завернут странно и неловко. По-видимому, браузеры не ...