UCS-2 e SQL Server

Question

Jan 25, 2012, 07:22 PM

UCS-2 e SQL Server

Enquanto opções de pesquisa para armazenar dados principalmente em inglês, mas às vezes não em um banco de dados do SQL Server que possa ser potencialmente grande, estou inclinado a armazenar a maioria dos dados de cadeia de caracteres conforme codificado em UTF-

No entanto, a Microsoft escolheu o UCS-2 por razões que não entendo completamente, o que está me levando a adivinhar essa tendência. A documentação do SQL Server 2012 mostra como criar um UTF-8 UDT, mas a decisão para o UCS-2 presumivelmente invade o SQL Serve

Wikipedia (que curiosamente observa que o UCS-2 é obsoleto em favor do UTF-16) observa que o UTF-8 é um conjunto de caracteres de largura variável capaz de codificar qualquer ponto de dados Unicode e queprovides the de facto standard encoding for interchange of Unicode text. Portanto, parece que qualquer caractere Unicode pode ser representado em UTF-8 e, como a maioria dos textos será em inglês, a representação será quase duas vezes mais compacta do que com o UCS-2 (sei que o disco é "barato", mas o cache do disco não é e a memória não se compara aos tamanhos de dados com os quais estou lidando. Muitas operações são degradadas exponencialmente quando o conjunto de trabalho é maior que a RAM disponível

Que problemas posso encontrar nadando no riacho UCS-2?