UCS-2 и SQL Server

Покаварианты исследования для хранения в основном базирующихся на английском, а иногда и не данных в базе данных SQL Server, которая потенциально может быть довольно большой, я склоняюсь к хранению большинства строковых данных в кодировке UTF-8.

Тем не менее, Microsoft выбрала UCS-2 по причинам, которые я не до конца понимаю, что заставляет меня переоценить эту склонность. Документация по SQL Server 2012 показывает, как создатьUTF-8 UDTно решение для UCS-2 предположительно пронизывает SQL Server.

Википедия (который интересно отмечает, что UCS-2 устарел в пользу UTF-16) отмечает, что UTF-8 является набором символов переменной ширины, способным кодировать любую точку данных Unicode, и что онprovides the de facto standard encoding for interchange of Unicode text, Таким образом, создается впечатление, что любой символ Unicode может быть представлен в UTF-8, и, поскольку большая часть текста будет английской, представление будет почти в два раза компактнее, чем в UCS-2 (я знаю, что диск «дешевый», но кэш диска не и память не в сравнении с размерами данных, с которыми я имею дело. Многие операции экспоненциально ухудшаются, когда рабочий набор больше доступной оперативной памяти).

С какими проблемами я могу столкнуться, плывя по течению UCS-2?

Ответы на вопрос(2)

Ваш ответ на вопрос