Python: Inflate и Deflate реализации
Я взаимодействую с сервером, который требует, чтобы отправляемые на него данные были сжаты с помощью Выкачивает алгоритм (кодировка Хаффмана + LZ77), а также отправляет данные, которые мне нужны, Inflate.
Я знаю, что Python включает Zlib, и что библиотеки C в Zlib поддерживают вызовы Inflate а также Выкачивает, но, очевидно, они не предоставляются модулем Python Zlib. Это обеспечиваетКомпрес а также Decompress, но когда я звоню, например, следующее:
result_data = zlib.decompress( base64_decoded_compressed_string )
Я получаю следующую ошибку:
Error -3 while decompressing data: incorrect header check
Gzip не лучше; при совершении звонка, например:
result_data = gzip.GzipFile( fileobj = StringIO.StringIO( base64_decoded_compressed_string ) ).read()
Я получаю сообщение об ошибке:
IOError: Not a gzipped file
который имеет смысл, так как данные являются Дефлированные файл не настоящий Сжат GZIP файл
Теперь я знаю, что есть Выкачивает реализация доступна (Pyflate), но я не знаю Inflate реализация
Кажется, есть несколько вариантов:
Найти существующую реализацию (идеал) Inflate а также Выкачивает в Python Напишите мое собственное расширение Python для библиотеки zlib c, которое включает в себя Inflate а также Выкачивает Вызовите что-нибудь еще, что может быть выполнено из командной строки (например, скрипт Ruby, так как Inflate/ Выкачивает вызовы в zlib полностью упакованы в Ruby)?Я ищу решение, но, не имея решения, буду благодарен за идеи, конструктивные мнения и идеи.
Дополнительная информаци: Результат дефлирования (и кодирования) строки должен, для нужных мне целей, дать тот же результат, что и следующий фрагмент кода C #, где входным параметром является массив байтов UTF, соответствующих данным для сжатия:
public static string DeflateAndEncodeBase64(byte[] data)
{
if (null == data || data.Length < 1) return null;
string compressedBase64 = "";
//write into a new memory stream wrapped by a deflate stream
using (MemoryStream ms = new MemoryStream())
{
using (DeflateStream deflateStream = new DeflateStream(ms, CompressionMode.Compress, true))
{
//write byte buffer into memorystream
deflateStream.Write(data, 0, data.Length);
deflateStream.Close();
//rewind memory stream and write to base 64 string
byte[] compressedBytes = new byte[ms.Length];
ms.Seek(0, SeekOrigin.Begin);
ms.Read(compressedBytes, 0, (int)ms.Length);
compressedBase64 = Convert.ToBase64String(,compressedBytes);
}
}
return compressedBase64;
}
Запуск этого кода .NET для строки «выкачать и закодировать меня» дает результат
7b0HYBxJliUmL23Ke39K9UrX4HShCIBgEyTYkEAQ7MGIzeaS7B1pRyMpqyqBymVWZV1mFkDM7Z28995777333nvvvfe6O51OJ/ff/z9cZmQBbPbOStrJniGAqsgfP358Hz8iZvl5mbV5mi1nab6cVrM8XeT/Dw==
Когда «выкачивай и кодируй меня» запускается через Python Zlib.compress (), а затем кодируется в base64, результатом является «eJxLSU3LSSxJVUjMS1FIzUvOT0lVyE0FAFXHB6k =».
Понятно, что zlib.compress () не является реализацией того же алгоритма, что и стандартный алгоритм Deflate.
Больше информаци:
Первые 2 байта данных .NET для дефлятирования ("7b0HY ...") после декодирования b64 равны 0xEDBD, что не соответствует данным Gzip (0x1f8b), данным BZip2 (0x425A) или данным Zlib (0x789C).
Первые 2 байта сжатых данных Python («eJxLS ...») после декодирования b64 равны 0x789C. Это заголовок Zlib.
Решаемые
Чтобы обработать необработанные значения deflate и inflate без заголовка и контрольной суммы, необходимо выполнить следующее:
On deflate / compress: удалить первые два байта (заголовок) и последние четыре байта (контрольная сумма).
На раздув / распаковка: есть второй аргумент для размера окна. Если это значение отрицательно, оно подавляет заголовки. вот мои методы в настоящее время, включая кодирование / декодирование base64 - и работают должным образом:
import zlib
import base64
def decode_base64_and_inflate( b64string ):
decoded_data = base64.b64decode( b64string )
return zlib.decompress( decoded_data , -15)
def deflate_and_base64_encode( string_val ):
zlibbed_str = zlib.compress( string_val )
compressed_string = zlibbed_str[2:-4]
return base64.b64encode( compressed_string )