Qual é a diferença entre 'combinar caracteres' e 'extensores de grafema' no Unicode?

Qual é a diferença entre'Combinação de caracteres' e'Extensores de grafema' em Unicode?

Eles parecem fazer a mesma coisa, até onde eu sei - embora o conjunto de extensores de grafema seja maior que o conjunto de caracteres combinados. Estou claramente perdendo algo aqui. Por que a distinção?

O Padrão Unicode, Capítulo 3, D52Personagem combinando: Um personagem com a Categoria Geral de Marca Combinada (M).Os caracteres combinados consistem emtodos os caracteres com os valores de categoria geral de marca de combinação de espaçamento (Mc), marca de não espaçamento (Mn) e marca de fechamento (Me).Todos os caracteres com classe de combinação canônica diferente de zero estão combinando caracteres, mas o inverso não é o caso: há caracteres combinados com uma classe de combinação canônica zero.A interpretação dos caracteres de uso privado (Co) como caracteres combinados ou não é determinada pela implementação.Esses caracteres normalmente não são usados isoladamente, a menos que estejam sendo descritos. Eles incluem caracteres como acentos, diacríticos, pontos hebraicos, sinais de vogais árabes e matras indic.O posicionamento gráfico de um caractere de combinação depende do último caractere base anterior, a menos que sejam separados por um caractere que não seja um caractere de combinação, nem marceneiro de largura zero ou não marceneiro de largura zero. Diz-se que o caractere de combinação se aplica a esse caractere base.Pode não haver esse caractere base, como quando um caractere combinado está no início do texto ou segue um caractere de controle ou formato - por exemplo, um retorno de carro, tabulação ou marca direita esquerda. Nesses casos, os caracteres combinados são chamados de caracteres combinados isolados.Com caracteres combinados isolados ou quando um processo é incapaz de executar a combinação gráfica, um processo pode apresentar um caractere de combinação sem combinação gráfica; isto é, pode apresentá-lo como se fosse um caractere base.As imagens representativas da combinação de caracteres são representadas com um círculo pontilhado nos gráficos de código. Quando apresentado em combinação gráfica com um caractere base anterior, esse caractere base deve aparecer na posição ocupada pelo círculo pontilhado.O Padrão Unicode, Capítulo 3, D59Extensor de Grafema: Um caractere com a propriedadeGrapheme_Extend.Os caracteres extensores Grapheme consistem em todas as marcas não espaçadoras, marceneiro com largura zero, não marceneiro com largura zero, U + FF9E, U + FF9F e um pequeno número de marcas de espaçamento.Um extensor de grafema pode ser concebido principalmente como o tipo de marca gráfica não espaçadora aplicada acima ou abaixo de outro caractere de espaçamento. marceneiro de largura zero e marceneiro de largura zero são formalmente definidos como extensores de grafema, de modo que sua presença não interrompa uma sequência de outros extensores de grafema.O pequeno número de marcas de espaçamento que possuem a propriedade Grapheme_Extend são todas as segundas partes de uma marca combinada de duas partes.O conjunto de caracteres com a propriedade Grapheme_Extend e o conjunto de caracteres com a propriedade Grapheme_Base são separados, por definição.

questionAnswers(3)

yourAnswerToTheQuestion