Czy istnieje sposób na przechowywanie słownika gzip z pliku?

Prowadzę badania nad klasyfikacją tekstu opartą na kompresji i próbuję wymyślić sposób przechowywania słownika zbudowanego przez koder (w pliku treningowym), aby można go było używać „statycznie” w pliku testowym? Czy to w ogóle możliwe przy użyciu narzędzia gzip UNIX?

Na przykład korzystałem z 2 plików „klasy” sportu.txt i atheism.txt, dlatego chcę uruchomić kompresję obu tych plików i przechowywać używane słowniki. Następnie chcę pobrać plik testowy (który nie jest oznakowany, może być ateizmem lub sportem) i korzystając ze wstępnie wbudowanych słowników na tym teście.txt, mogę przeanalizować, jak dobrze kompresuje pod tym słownikiem / modelem.

Dzięki

questionAnswers(1)

yourAnswerToTheQuestion