CUDA - o ile wolniej transferuje się przez PCI-E?

Jeśli przeniosę pojedynczy bajt z jądra CUDA do PCI-E do hosta (pamięć zerowej kopii), ile to jest powolne w porównaniu z transferem około 200 megabajtów?

Chciałbym wiedzieć, ponieważ wiem, że transfer przez PCI-E jest powolny dla jądra CUDA, to: czy coś zmienia, jeśli przesyłam tylko jeden bajt lub ogromną ilość danych? A może dlatego, że transfery pamięci są wykonywane w „masach”, przesyłanie pojedynczego bajtu jest niezwykle kosztowne i bezużyteczne w odniesieniu do transferu 200 MB?

questionAnswers(1)

yourAnswerToTheQuestion