для традиционного китайского. Я также видел китайские документы, представленные в

859 поддерживает символы латинского алфавита, мне нужно использовать iso-8859-1 в java-программе для чтения файла на китайском языке, и в чем разница между этим

Ответы на вопрос(2)

упрощенное и традиционное). Видетьhttp://download.oracle.com/javase/6/docs/technotes/guides/intl/encoding.doc.html для списка. Наиболее распространенными являютсяGB2312 акаEUC_CN для упрощенного китайского иBig5 для традиционного китайского. Я также видел китайские документы, представленные вUTF-8.

ют 256 комбинаций, что нормально для большинства расширений латинского алфавита, но не для китайских символов.

ISO-8859-1 является одной из «версий» ISO-8859, поддерживающей большинство западноевропейских языков (французский, немецкий, испанский, ...). Для центрально-европейских языков (польский, чешский, словацкий, ...) вам нужен ISO-8859-2 и т. Д.

Одним из различий между ISO-8859-1 и ISO-8859-2 является французская букваè в ISO-8859-1, который находится в той же позиции, что и чешская / словацкая букваč в ISO-8859-2. Вот почему вы не могли объединить эти две буквы в один текст.

Теперь с Unicode можно комбинировать и китайские символы.

 DarkDust17 янв. 2011 г., 10:25
@vijay: нет кодовой страницы ISO 8859 для китайских символов, поскольку 8859 может предоставить только 128 дополнительных символов к стандартному набору ASCII ... но набор китайских символов превышает несколько тысяч "символов". Для этого используйте вариант Unicode (UTF-8, UTF-16, UTF-32).
 eumiro17 янв. 2011 г., 10:24
Если вам абсолютно необходим номер ISO, ищите ISO 10646.
 vijay17 янв. 2011 г., 10:20
спасибо за ваш ответ, так что если мне нужно работать с китайским иероглифом, который мне нужно использовать
 DarkDust17 янв. 2011 г., 10:22
Кстати, альтернативой ISO 8859-1 является ISO 8859-15, который почти идентичен -1, но включает знак евро (и несколько небольших диакритических знаков).

Ваш ответ на вопрос