Надеюсь, вы не возражаете ... Я отвечу на этих выходных.

льку у меня есть только APU AMD A10-7850, и у меня нет средств, чтобы тратить их на видеокарту NVIDIA стоимостью 800–1200 долларов, я стараюсь использовать имеющиеся у меня ресурсы для ускорения глубокого обучения с помощью tenorflow / keras. ,

Изначально я использовал предварительно скомпилированную версию Tensorflow. InceptionV3 потребовалось бы около 1000-1200 секунд для вычисления 1 эпохи. Это было мучительно медленно.

Чтобы ускорить вычисления, я сначала скомпилировал Tensorflow с оптимизаторами (используя инструкции AVX и SSE4). Это привело к сокращению времени вычислений примерно на 40%. Те же вычисления, что были выполнены выше, теперь занимают около 600 секунд. Это почти терпимо - вроде как ты можешь наблюдать, как краска высыхает.

Я ищу способы дальнейшего сокращения времени вычислений. У меня есть только интегрированная видеокарта AMD, которая является частью APU. (Как) (C / c) я использую этот ресурс, чтобы еще больше ускорить вычисления?

В более общем смысле, скажем, есть другие люди с аналогичными денежными ограничениями и настройками Intel. Как может кто-либо БЕЗ дискретных карт NVIDIA использовать свои встроенные графические чипы или другие установки, отличные от NVIDIA, для достижения скорости, превышающей производительность только на процессоре? Это возможно? Почему, почему нет? Что нужно сделать для достижения этой цели? Или это будет возможно в ближайшее время (2-6 месяцев)? Как?

Ответы на вопрос(2)

Ваш ответ на вопрос