¿Cómo puedo acelerar el aprendizaje profundo en una configuración que no sea NVIDIA?

Como solo tengo una APU AMD A10-7850 y no tengo los fondos para gastar en una tarjeta gráfica NVIDIA de $ 800- $ 1200, estoy tratando de cumplir con los recursos que tengo para acelerar el aprendizaje profundo a través de tensorflow / keras .

Inicialmente, utilicé una versión precompilada de Tensorflow. InceptionV3 tomaría alrededor de 1000-1200 segundos para calcular 1 época. Ha sido dolorosamente lento.

Para acelerar los cálculos, primero autocompilé Tensorflow con optimizadores (usando las instrucciones AVX y SSE4). Esto conduce a una disminución de aproximadamente el 40% en los tiempos de cálculo. Los mismos cálculos realizados anteriormente ahora solo tardan unos 600 segundos en computarse. Es casi soportable, como si pudieras ver la pintura seca.

Estoy buscando formas de disminuir aún más los tiempos de cálculo. Solo tengo una tarjeta gráfica AMD integrada que forma parte de la APU. (¿Cómo?) (C / c) y puedo hacer uso de este recurso para acelerar aún más la computación?

En términos más generales, digamos que hay otras personas con restricciones monetarias similares y configuraciones de Intel. ¿Cómo puede alguien SIN tarjetas discretas de NVIDIA hacer uso de sus chips gráficos integrados o de otra manera configuración que no sea NVIDIA para lograr un rendimiento más rápido que el de solo CPU? ¿Es eso posible? ¿Por qué por qué no? ¿Qué hay que hacer para lograr este objetivo? ¿O será esto posible en el futuro cercano (2-6 meses)? ¿Cómo?

Respuestas a la pregunta(2)

Su respuesta a la pregunta