Como paralelizar cálculos de compreensão de lista em Python?

Tanto a compreensão de lista quanto o cálculo de mapas devem - pelo menos em teoria - ser relativamente fáceis de paralelizar: cada cálculo dentro de uma compreensão de lista pode ser feito independentemente do cálculo de todos os outros elementos. Por exemplo na expressão

[ x*x for x in range(1000) ]

cada cálculo x * x (pelo menos em teoria) poderia ser feito em paralelo.

Minha pergunta é: Existe algum truque do Python-Module / Python-Implementation / Python Programming-Trick para paralelizar um cálculo de compreensão de lista (para usar todos os núcleos 16/32 / ... ou distribuir o cálculo por uma grade de computador ou sobre uma nuvem)?

questionAnswers(8)

yourAnswerToTheQuestion