Uso de memória Python de matrizes numpy

Eu estou usando python para analisar alguns arquivos grandes e estou correndo em problemas de memória, então eu tenho usado sys.getsizeof () para tentar acompanhar o uso, mas é um comportamento com matrizes numpy é bizarro. Aqui está um exemplo envolvendo um mapa de albedos que estou tendo que abrir:

>>> import numpy as np
>>> import struct
>>> from sys import getsizeof
>>> f = open('Albedo_map.assoc', 'rb')
>>> getsizeof(f)
144
>>> albedo = struct.unpack('%df' % (7200*3600), f.read(7200*3600*4))
>>> getsizeof(albedo)
207360056
>>> albedo = np.array(albedo).reshape(3600,7200)
>>> getsizeof(albedo)
80

Bem, os dados ainda estão lá, mas o tamanho do objeto, um mapa de 3600x7200 pixels, passou de ~ 200 Mb para 80 bytes. Eu gostaria de esperar que meus problemas de memória acabem e apenas converter tudo em matrizes numpy, mas eu sinto que esse comportamento, se for verdade, violaria de alguma forma alguma lei da teoria da informação ou termodinâmica, ou algo assim, então eu sou inclinado a acreditar que getsizeof () não funciona com matrizes numpy. Alguma ideia?

questionAnswers(2)

yourAnswerToTheQuestion