Результаты поиска по запросу "python-unicode"

1 ответ

Удаление Unicode \ u2026 как символы в строке в python2.7

У меня есть строка в Python2.7, как это, This is some \u03c0 text that has to be cleaned\u2026! it\u0027s annoying!Как мне преобразовать это в это, This is some text that has to be cleaned! its annoying!

1 ответ

Open () и codecs.open () в Python 2.7 ведут себя странно по-разному

У меня есть текстовый файл с первой строкой символов Unicode и всех других строк в ASCII. Я пытаюсь прочитать первую строку как одну переменную, а все остальные строки как другую. Тем не менее, когда я использую следующий код: # -*- coding: ...

1 ответ

Отображение ширины строк Юникода в Python [дубликаты]

На этот вопрос уже есть ответ: Нормализация Юникода [/questions/16467479/normalizing-unicode] 2 ответа Как я могу определить ширину отображения строки Unicode в Python 3.x, и есть ли способ использовать эту информацию для выравнивания этих ...

ТОП публикаций

2 ответа

Python Латинские символы и Юникод

2 ответа

Pytesseract: UnicodeDecodeError: кодек 'charmap' не может декодировать байт

Я запускаю большое количество OCR на скриншотах с Pytesseract. Это работает хорошо в большинстве случаев, но небольшое количество вызывает эту ошибку:

2 ответа

Python2 имеет байты и строку в виде знака без знака и юникод как UCS-2 (поэтому кодовые точки выше 65535 будут кодироваться с 2 символами (UCS2) в Python2 и только одним символом (UTF-32) в Python3)

, где и как Python неявно применяет кодирование к строкам или неявное транскодирование (преобразование)? И каковы эти кодировки по умолчанию (т.е. подразумеваемые)? Например, каковы кодировки: строковых литералов? s = "Byte string with ...

2 ответа

Python 2.7 строчные

Когда я использую.lower() в Python 2.7 строка не преобразуется в строчные буквыŠČŽ, Я читаю данные из словаря. Я пытался с помощьюstr(tt["code"]).lower(), tt["code"].lower(). Какие-либо предложения ?

3 ответа

Чтение данных на русском языке из CSV

У меня есть некоторые данные в CSV-файле на русском языке:

3 ответа

UnicodeDecodeError: кодек «utf8» не может декодировать байт 0x80 в позиции 3131: недопустимый начальный байт

Я пытаюсь прочитать данные Twitter из файла JSON с помощью Python 2.7.12.Код, который я использовал, такой:

3 ответа

Вот

ел бы перебрать строку и вывести все смайлики. Я пытаюсь перебрать символы и сравнить их ссписок смайликов [https://raw.githubusercontent.com/vincentmwong/emoji_list/master/emoji_list/__init__.py] . Тем не менее, Python, кажется, разбивает ...