¿Algún buen recurso sobre patrones de diseño para arquitecturas paralelas?

Un poco de historia:

Estoy comenzando con GPGPU (OpenCL), estoy usando un contenedor java (jogamp.jocl) con la esperanza de que me proporcione una forma de abstraer el nivel de nitidez de bajo nivel y usar OOP estándar en niveles más altos. Ya puedo ver en los diversos ejemplos de Hello World que tendré que administrar las colas yo mismo.

Mi pregunta:

¿Hay patrones conocidos para GPGPU o buenos recursos (como en los libros) sobre patrones de diseño para arquitecturas paralelas masivas en general?

Mi enfoque está en las simulaciones biológicas, pero realmente no debería marcar la diferencia.

Respuestas a la pregunta(2)

Su respuesta a la pregunta