Como lidar com memória de derramamento no porco

Meu código é assim:

pymt = LOAD 'pymt' USING PigStorage('|') AS ($pymt_schema);

pymt_grp = GROUP pymt BY key

results = FOREACH pymt_grp {

      /*
       *   some kind of logic, filter, count, distinct, sum, etc.
       */
}

Mas agora eu encontro muitos logs assim:

org.apache.pig.impl.util.SpillableMemoryManager: Spilled an estimate of 207012796 bytes from 1 objects. init = 5439488(5312K) used = 424200488(414258K) committed = 559284224(546176K) max = 559284224(546176K)

Na verdade eu acho a causa, a razão maior é que existe uma tecla "hot", alguma coisa como key = 0 como endereço ip, mas eu não quero filtrar essa chave. existe alguma solução? Implementei interface algébrica e acumuladora na minha UDF.

questionAnswers(1)

yourAnswerToTheQuestion