ProcessPoolExecutor de concorrentes.futures muito mais lento do que multiprocessamento.Pool
Eu estava experimentando com o novo brilhanteconcorrente.futures módulo introduzido no Python 3.2, e notei que, quase com código idêntico, usando o Pool de concorrentes.Futures écaminho mais lento do que usandomultiprocessamento.Pool.
Esta é a versão usando multiprocessamento:
def hard_work(n):
# Real hard work here
pass
if __name__ == '__main__':
from multiprocessing import Pool, cpu_count
try:
workers = cpu_count()
except NotImplementedError:
workers = 1
pool = Pool(processes=workers)
result = pool.map(hard_work, range(100, 1000000))
E isso está usando o concorrente.futures:
def hard_work(n):
# Real hard work here
pass
if __name__ == '__main__':
from concurrent.futures import ProcessPoolExecutor, wait
from multiprocessing import cpu_count
try:
workers = cpu_count()
except NotImplementedError:
workers = 1
pool = ProcessPoolExecutor(max_workers=workers)
result = pool.map(hard_work, range(100, 1000000))
Usando uma função de fatoração ingênua tirada desteArtigo de Eli Bendersky, estes são os resultados no meu computador (i7, 64 bits, Arch Linux):
[juanlu@nebulae]─[~/Development/Python/test]
└[10:31:10] $ time python pool_multiprocessing.py
real 0m10.330s
user 1m13.430s
sys 0m0.260s
[juanlu@nebulae]─[~/Development/Python/test]
└[10:31:29] $ time python pool_futures.py
real 4m3.939s
user 6m33.297s
sys 0m54.853s
Eu não posso fazer o perfil deles com o profiler do Python porque recebo erros de pickle. Alguma ideia?