Результаты поиска по запросу "unicode"

2 ответа

HTML кодирование и разбор lxml

Я пытаюсь, наконец, решить некоторые проблемы с кодированием, которые возникают при попытке очистить HTML с помощью lxml. Вот три примера HTML-документов, с которыми я столкнулся: 1. <!DOCTYPE html> <html lang='en'> <head> <title>Unicode Chars: ...

2 ответа

Кодек 'ascii' не может кодировать символ в позиции * или вне диапазона (128)

В stackoverflow есть несколько потоков, но я не смог найти правильного решения проблемы в целом. Я собрал огромные суммы текстовых данных из функции чтения urllib и сохранил их в файлах pickle. Теперь я хочу записать эти данные в файл. Во время ...

2 ответа

расположение памяти в строках Unicode

Я знаю, кто-то объясняет, почему, когда я создаю одинаковые строки Unicode в Python 2.7, они не указывают на то же место в памяти, как в «обычных» строках >>> a1 = 'a' >>> a2 = 'a' >>> a1 is a2 Trueхорошо, это было то, что я ожидал, но >>> ua1 ...

ТОП публикаций

3 ответа

Как работает UTF-8 «кодирование с переменной шириной»?

В стандарте Unicode достаточно кодов, чтобы хранить их все 4 байта. Вот что делает кодировка UTF-32. Тем не менее, кодировка UTF-8 каким-то образом сжимает их в гораздо меньшие пространства с помощью так называемого «кодирования с переменной ...

4 ответа

Java не может открыть файл с суррогатными значениями Unicode в имени файла?

Я имею дело с кодом, который выполняет различные операции ввода-вывода с файлами, и я хочу, чтобы он мог работать с международными именами файлов. Я работаю на Mac с Java 1.5, и если имя файла содержит символы Unicode, которые требуют суррогатов, ...

1 ответ

В терминале Mac китайские иероглифы отображаются как вопросительные знаки

Я пытаюсь извлечь некоторые из кодированных в кодировке UTF-8 китайских символов из базы данных, используя файл Java. Когда я делаю это, символы возвращаются в виде вопросительных знаков. Однако, когда я отображаю символы из базы данных ...

1 ответ

Печать строк UTF-8 с использованием широких и многобайтовых строковых литералов printf

В таких операторах, где оба они вводятся в исходный код с одинаковой кодировкой (UTF-8) и локаль настроена правильно, есть ли практическая разница между ними? printf("ο Δικαιοπολις εν αγρω εστιν\n"); printf("%ls", L"ο Δικαιοπολις εν ...

8 ответов

SSIS конвертировать между Unicode и Non-Unicode Error

У меня есть пакет ssis, где я использую источник OLEDB, ссылающийся на таблицу SQL Server 2005. Все столбцы, кроме столбца даты, являются NVARCHAR (255). Я использую пункт назначения Excel и использую инструкцию SQL для создания листа в книге ...

2 ответа

Можем ли мы переключаться между ASCII и Unicode?

Я наткнулся на то, что «переменная char имеет формат Unicode, но также хорошо переносит / сопоставляет с ASCII». Что нужно упомянуть об этом? Конечно, ASCII равен 1 байту, а Unicode равен 2. И в нем Unicodeitself содержится код ASCII ...

2 ответа

Мне нужна помощь, чтобы получить нормально выглядящую стрелку Юникода в UILabel, как это ⬇

Я хотел бы получить стрелку вниз для отображения внутри UILabel. Конкретно ⬇ Юникод: U + 2B07. Это порядок сортировки заголовка столбца. Я видел код для отображения символов Юникода, и когда я использую его для символа выше, он не отображается ...