Результаты поиска по запросу "gpu"

2 ответа

2d массив символов для ядра CUDA

Мне нужна помощь с переводом char [] [] в ядро Cuda. Это мой код: __global__ void kernel(char** BiExponent){ for(int i=0; i<500; i++) printf("%c",BiExponent[1][i]); // I want print line 1 } int main(){ char (*Bi2dChar)[500] = new char ...

3 ответа

Я получил дополнительную информацию от

ю, что устройства до архитектуры Fermi имели 8 SP в одном мультипроцессоре. То же самое в архитектуре Ферми?

2 ответа

docs.nvidia.com/cuda/cuda-math-api/...

ного гуглю, но сейчас мне неясно, могут ли некоторые графические процессоры, запрограммированные с CUDA, использовать преимущества или использовать инструкции, аналогичные тем, которые есть в расширениях SSE SIMD; например, можем ли мы ...

ТОП публикаций

3 ответа

Надеюсь, что мое решение поможет другим.

есть приложение, которое используетMetal оказывать. Это приложение корректно работает на устройствах под управлением iOS11. При использовании одного и того же приложения на устройствах под управлением iOS12 у нас начались глюки и ...

0 ответов

Но это реализация тензорного потока с использованием этих алгоритмов или нет?

уПрограмма сравнения строк на основе GPU с использованием расстояния редактирования с помощью tenorflowфункции. Зная соответствующую часть, я извлеку детали, а затем сохраню их в таблице данных, которая в конечном итоге будет сохранена в виде ...

1 ответ

, поскольку он обеспечивает необходимый фильтр DirectShow (а также поддерживает все фильтры ffmpeg, может отображать субтитры и т. д.)

твует ли аппаратно ускоренная версия FFmpeg (например, версия, использующая графический процессор)? Кроме того, кто-нибудь использует FFmpeg с поддержкой GPU? Возможно для масштабирования и конвертирования видео формата? Или, например, ...

1 ответ

@ ofer.sheffer: я написал: «Обратите внимание, что если бы размер входных данных не был выражен в виде простого округления, кратного размеру блока, то число блоков необходимо было бы округлить, чтобы охватить полный набор входных данных». Разве это не достаточно ясно?

ичок в CUDA и мне нужна помощь в понимании некоторых вещей. Мне нужна помощь в распараллеливании этих двух циклов. В частности, как настроить dimBlock и dimGrid, чтобы сделать это быстрее. Я знаю, что это выглядит как пример добавления вектора в ...

1 ответ

Блестящий ответ, большое спасибо! :)

у вас есть рабочие элементы, выполняющиеся в волновом фронте, и есть условие, такое как: if(x){ ... } else{ .... }Что выполняют рабочие элементы? это тот случай, когда все рабочие элементы в волновом фронте будут выполнять первую ветвь (т.е.x ...

1 ответ

L2 кеш в Кеплере

Как работает кэш L2 в графических процессорах с архитектурой Kepler с точки зрения локальности ссылок? Например, если поток обращается к адресу в глобальной памяти, предполагая, что значение этого адреса отсутствует в кэше L2, как кэшируется ...

7 ответов

. Напишите сейчас, я использую scikits и вполне удовлетворяю до сих пор.

тоящее время я работаю над проектом на Python, и я хотел бы использовать графический процессор для некоторых расчетов. На первый взгляд кажется, что доступно много инструментов; на второй взгляд, я чувствую, что я что-то упустил. Copperhead ...