делает) и связать имя поддиапазона с каждой кодовой точкой.

аюсь найти ресурс, который можно использовать для подключения языков (или, скорее, сценариев) к блокам символов Юникода. Такой ресурс будет использоваться для поиска таких вопросов, как "Какие блоки Unicode используются на французском языке?" или "На каких языках использовать блок от 0A80-0AFF (http://unicodinator.com/#Block-Gujarati)? "Знаете ли вы о таком ресурсе?

Я ожидал, что смогу легко найти эту информацию наunicode.org, Я быстро смог найти отличную таблицу, которая связывает коды стран с языками (http://unicode.org/repos/cldr-tmp/trunk/diff/supplemental/territory_language_information.html). Но я потратил немало времени на поиски чего-то, что связывает блоки Unicode с языками. Возможно, у меня есть проблема с терминологией, мешающая мне соединить точки здесь ...

Я не придирчив к тому, что в данном случае означает «язык» (код Java Locale, код ISO 639 или любой другой). Я также понимаю, что не может быть точных ответов, потому что, например, арабский документ может содержать латинский и другой текст в дополнение к символам из арабских блоков (http://unicodinator.com/#Block-Arabic, http://unicodinator.com/#Block-Arabic_Supplement). Но наверняка должна быть какая-то таблица, которая говорит, что «эти языки идут с этими блоками» ... Я также не придирчив к формату (XML, CSV, что угодно), я могу легко преобразовать это в данные, которые я могу использовать для своего приложения , И снова, я понимаю, что ссылка, вероятно, соединитСценарии к блокам, а не к языкам (хотя сценарии могут быть сопоставлены с языками).

Я понимаю, что это будет таблица «многие ко многим» (поскольку многие языки используют символы из нескольких блоков, а многие блоки используются несколькими языками); Я действительно понимаю, что на это нельзя дать точного ответа, поскольку кодовые точки Unicode не зависят от языка - однако, также не может быть и вопроса «какие языки существуют в этой стране» (ответ, вероятно, «большинство из них» для большинства стран), но таблица нравится (http://unicode.org/repos/cldr-tmp/trunk/diff/supplemental/territory_language_information.html) еще можно создать, содержательно и полезно.

ОтносительноПочему Я хотел бы такую ​​вещь: я хотел бы улучшитьhttp://unicodinator.com с глобальными тепловыми картами для блоков кода и списками языков; У меня также есть концепция игры, с которой я возился. Помимо этого, вероятно, есть много других применений, которые другие люди могли бы использовать для этого (создание шрифтов - эвристическое, быстрое, наиболее подходящее определение языка сейчас, когда API Google Translate исчезает - исследовательские проекты?).

Ответы на вопрос(4)

Ваш ответ на вопрос