Backpropagation multithreaded

Eu escrevi uma classe de propagação de retorno no VB.NET - funciona bem - e estou usando-a em um projeto de inteligência artificial em C

Mas eu tenho um AMD Phenom X3 em casa e um Intel i5 na escola. e minha rede neural não é multiencadeada.

Como converter essa classe de propagação de volta em um algoritmo multithread? ou como usar a programação GPGPU? ou devo usar bibliotecas de terceiros que tenham uma rede neural de propagação traseira multithrea