Wyniki wyszukiwania dla "cuda"
Jak skopiować pamięć przydzieloną w funkcji urządzenia z powrotem do pamięci głównej
Mam program CUDA zawierający funkcję hosta i funkcję urządzeniaWykonać(). W funkcji hosta przydzielam pamięć globalnąwydajność który zostanie następnie przek...
Jak poprawnie rzucić globalną tablicę pamięci za pomocą wektora uint4 w CUDA, aby zwiększyć przepustowość pamięci?
Zasadniczo istnieją dwie techniki zwiększania przepustowości pamięci globalnej w jądrze CUDA na możliwości obliczeniowe 1.3 GPU; pamięć uzyskuje dostęp do ko...
Problemy związane z Open MPI podczas tworzenia próbek CUDA 5.0 (Mac OS X ML)
Gdy próbuję utworzyć próbki CUDA 5.0, pojawia się błąd:Makefile: 79:* Nie znaleziono MPI, nie buduje simpleMPI .. Zatrzymaj.Próbowałem pobrać i zbudować najn...
Równoległy tensor Kroneckera na procesorach graficznych wykorzystujących CUDA
Pracuję w parallelise [ten plik] [1] na GPU używając [plik PTX z matlab parallel.gpu.CUDAkernel] [2]. Mój problem z [kron tensor product] [3] jest następując...
CUDA 5.0: Zastąpienie cutil.h?
Chcę skompilować stary projekt (oparty na CUDA 2.3) z nowym CUDA 5.0. Niestety wykorzystuje on stary nagłówek cutil.h, który nie jest już dostępny w CUDA 5.0...
nie można użyć printf w funkcji jądra cuda
Wygląda na to że
Różnica w tworzeniu kontekstu CUDA
Mam program, który używa trzech jąder. Aby uzyskać przyspieszenia, robiłem fałszywą kopię pamięci, aby utworzyć kontekst w następujący sposób:
printf z -arch = sm_20 nie pokazuje anaything w pliku jądra
Dodałem kilka instrukcji printf do mojego programu cuda