Лучший алгоритм сжатия для XML?

Я почти ничего не знаю о сжатии, так что терпите меня (это, вероятно, глупый и болезненно очевидный вопрос).

Допустим, у меня есть XML-файл с несколькими тегами.

<verylongtagnumberone>
  <verylongtagnumbertwo>
    text
  </verylongtagnumbertwo>
</verylongtagnumberone>

Теперь предположим, что у меня есть несколько этих очень длинных тегов со многими атрибутами в моих нескольких XML-файлах. Мне нужно сжать их до минимально возможного размера. Лучшим способом было бы использовать специфичный для XML алгоритм, который присваивает отдельные теги псевдонимам, таким как vlt1 или vlt2. Однако это не будет "открытым". пути, как я пытаюсь пойти, и я хочу использовать общий алгоритм, как DEFLATE или LZ. Также помогает, если архив был .zip-файлом.

Поскольку я имею дело с обычным текстом (без двоичных файлов, таких как изображения), мне нравится алгоритм, который подходит для простого текста. Какой из них дает наименьший размер файла (предпочтительны алгоритмы без потерь)?

Кстати, сценарий таков: я создаю стандарт для документов, таких как ODF или MS Office XML, которые содержат файлы XML, упакованные в ZIP-архив.

РЕДАКТИРОВАТЬ: «шифрование»; вещь была опечаткой; он должен иметь «сжатие».

Ответы на вопрос(8)

Ваш ответ на вопрос