Diferencias de CPU y GPU

¿Cuál es la diferencia entre una sola unidad de procesamiento de CPU y una sola unidad de procesamiento de GPU?
La mayoría de los lugares que he visitado en Internet cubren las diferencias de alto nivel entre los dos. Quiero saber qué instrucciones puede realizar cada uno y qué tan rápido son y cómo se integran estas unidades de procesamiento en la arquitectura de la competencia.
Parece una pregunta con una respuesta larga. Así que muchos enlaces están bien.

editar:
En la CPU, la FPU ejecuta operaciones de números reales. ¿Qué tan rápido se realizan las mismas operaciones en cada núcleo de GPU? Si es rápido, ¿por qué es rápido?
Sé que mi pregunta es muy genérica, pero mi objetivo es que me respondan.

Respuestas a la pregunta(3)

Su respuesta a la pregunta