Как открыть / поток .zip файлов через Spark?
У меня есть zip-файлы, которые я хотел бы открыть через Spark. Я могу открыть файл .gzip без проблем из-за поддержки родного кодека Hadoops, но не могу сделать это с файлами .zip.
Есть ли простой способ прочитать zip-файл в вашем коде Spark? Я также искал реализации zip-кодеков для добавления в CompressionCodecFactory, но пока безуспешно.