Por que uma versão encadeada desse script Perl em particular é 200 vezes mais lenta que sua contraparte não encadeada?

A apresentação porMikhael Goikhman de uma conferência Perl de 2003 inclui dois exemplos de scripts de localização de números primos.1 é encadeado ede outros não é. Ao executar os scripts (linhas de impressão comentadas), obtive um tempo de execução de 0,011s no sem thread e de 2,343 (!) Segundos na versão com threads. O que explica a diferença impressionante nos tempos?

Eu tenho alguma experiência com threads em Perl e notei antes que os tempos de criação de thread podem ser particularmente brutais, mas isso não parece ser o gargalo no exemplo de Goikham.