Результаты поиска по запросу "utf-16"

1 ответ

Да, все существующие в настоящее время кодовые точки Unicode будут помещаться в один модуль UTF-32.

a строка имеет методы:

8 ответов

И что ты делаешь со строками? Если просто сохранить и отобразить, то это почти никогда не будет проблемой, если только вы не попытаетесь определить видимую длину строки по количеству символов (что также является плохой идеей по другим причинам). Однако в целях разбора ... В зависимости от характера разбора он может превратиться в банку с червями.

ите, пожалуйста, как работает UTF16? Я немного растерялся, учитывая эти моменты: В C ++ есть статический тип WCHAR длиной 2 байта. (всегда 2 байта длиной obvisouly)Большая часть msdn и некоторой другой документации, похоже, предполагают, что ...

1 ответ

Я не смог найти функцию для этого, но это работает:

есть несколько суррогатных пар (или 2-байтовых utf8?) Символов, таких как�� это смайлики для молитвенных рук, хранящиеся как UTF8 в виде 2 символов. При отображении в браузере эта строка отображается как два пример: Мне нужно ...

ТОП публикаций

1 ответ

Конечно, я никогда не пришел бы к такому решению, и что я видел некоторые регулярные выражения. Еще раз большое спасибо.

я есть следующий пример кода: var inputString = "ñaáme"; inputString = inputString.Replace('ñ', '\u00F1'); var normalizedString = inputString.Normalize(NormalizationForm.FormD); var result = Regex.Replace(normalizedString, @"[^ñÑa-zA-Z0-9\s]*", ...

3 ответа

 преобразовать обратно из байта в строку. Таким образом, вы уверены, что все происходит в кодировке Unicode.

аюсь прочитать строку в схеме кодирования UTF-16 и выполнить хеширование MD5 на нем. Но, как ни странно, Java и C # возвращают разные результаты, когда я пытаюсь это сделать. Ниже приведен фрагмент кода вЯва: public static void main(String[] ...

1 ответ

 функция. Потребуется преобразовать std :: wstring в std :: string (utf16 в utf8), если вам это нужно и для wstring (что может сделать это довольно дорогим решением, поэтому я ищу себе лучшее решение, если возможно с чистым C ++ (11) означает).

есно, как нормализовать строки (содержащие utf-8 / utf-16) в C / C ++. В .NET есть функцияString.Normalize [http://msdn.microsoft.com/en-us/library/ebza6ck1.aspx] . Я использовал UTF8-CPP в прошлом, но он не предоставляет такой ...

2 ответа

) ...

я проблемы с выводом data.frame с помощьюwrite.csv используя кодировку UTF-16. Справочная информация: я пытаюсь записать файл CSV из data.frame для использования в Excel. Excel Mac 2011, похоже, не любит UTF-8 (если я указываю UTF-8 во время ...

0 ответов

это решает проблему?

ал часы сегодня и просто не могу найти что-нибудь, что работает для меня. Тот, на которого я только что посмотрел, без удачи, "Как преобразовать std :: string в кодировке UTF-8 в std :: string в формате ...

2 ответа

Отлично, это помогло. У меня есть именно тот код, который я использовал, чтобы исправить это. Я получил поток ответов через WebClient (в массиве byte []). Затем я просто запустил автоматическое преобразование UTF-8 в UTF-16 в массиве byte [], чтобы получить правильную строку. Точный код я опубликую завтра, когда мне будет позволено опубликовать ответ. Спасибо за вашу помощь @Remus

у данные с помощьюSystem.Net.WebClient с веб-сайта, и когда данные возвращаются, все анализируется и выглядит хорошо, за исключением букв с акцентами. Например, когда он возвращаетéSQL Server 2008 сохраняет его какé. Просто нужно выяснить, как ...

3 ответа

Да, и, наконец, для веб-контента быть меньше для диапазона ASCII, как правило, важнее, чем меньше для символов CJK, даже для контента CJK. Большая часть веб-контента хранится с разметкой HTML или XML, и все они находятся в диапазоне ASCII. Поскольку UTF-16 в два раза больше, чем UTF-8 для символов в диапазоне ASCII, в то время как UTF-8 в два раза больше, чем UTF-16 для символов CJK, и поскольку большая часть контента фактически является разметкой, транскодирование в Интернете страницы от UTF-8 до UTF-16 почти всегда увеличивают свой размер, даже если они все написаны на японском или китайском языках.

бы у вас был веб-сайт, который должен был быть переведен на все языки мира, и, следовательно, имелась база данных со всеми этими переводами, какая кодировка символов была бы лучшей? UTF-128? Если да, все ли браузеры понимают выбранную кодировку? ...