Результаты поиска по запросу "vectorization"

1 ответ

 чтобы понять, как это работает.

у векторизовать функциюf(a, b) так что, когда я ввожу a и b как два вектора, тензор комбинаций возвращается. Вот иллюстративный пример: import numpy as np def tester(a, b): mysumm = 0. for ii in range(a): for jj in range(b): mysumm += a * b ...

5 ответов

https://github.com/jeremysalwen/vectrig

считываю рассчитать высокопараллельные тригонометрические функции (в блоке, например, 1024), и я хотел бы воспользоваться, по крайней мере, некоторыми из параллелизма, который есть в современных архитектурах. Когда я компилирую блок for(int ...

1 ответ

Что касается пропусков кэша, я понимаю, что преобразования цикла изменят способ доступа к данным, который не является той же последовательностью, в которой они хранятся (например, для основной строки в C), но в качестве первого среза я попытаюсь увидеть какой прирост производительности я получу и пока буду жить с промахами кеша.

я есть реализация матричного решателя на основе BiCCG (Conjugate Gradient), который также учитывает периодичность. Случается, что реализация требует значительных вычислительных ресурсов, и цикл не векторизован автоматически из-за проблемы с ...

ТОП публикаций

3 ответа

Найти расстояние от одной точки в матрице до всех других точек в матрице

У меня есть матрицаa и я хочу рассчитатьрасстояние от одной точки до всех остальных точек, Таким образом, матрица результатов должна иметь ноль (в выбранной мной точке) и должна отображаться в виде некоего круга чисел вокруг этой конкретной ...

2 ответа

docs.nvidia.com/cuda/cuda-math-api/...

ного гуглю, но сейчас мне неясно, могут ли некоторые графические процессоры, запрограммированные с CUDA, использовать преимущества или использовать инструкции, аналогичные тем, которые есть в расширениях SSE SIMD; например, можем ли мы ...

4 ответа

 компилятор из ключевого слова в подсказку об отсутствии псевдонимов блоков памяти между тремя массивами.

жно, очень тупой вопрос. Я пытаюсь "векторизовать" следующий цикл: set.seed(0) x <- round(runif(10), 2) # [1] 0.90 0.27 0.37 0.57 0.91 0.20 0.90 0.94 0.66 0.63 sig <- sample.int(10) # [1] 1 2 9 5 3 4 8 6 7 10 for (i in seq_along(sig)) x[i] <- ...

1 ответ

@PeterCordes Должен ли я превратить этот ответ в вики сообщества, чтобы вы могли вставить свой ответ здесь? К сожалению, я не могу не принять мой ответ.

у некоторыеAVX код и мне нужно загрузить из потенциально невыровненной памяти. Я сейчас загружаю 4двойникиследовательно, я бы использовал внутреннюю инструкцию _mm256, _loadu_pd [https://software.intel.com/en-us/node/524102]; код, который ...

1 ответ

Очень интересно, спасибо!

накомо понятие «векторизация» и то, как pandas использует векторизованные методы для ускорения вычислений. Векторизованные функции транслируют операции по всей серии или DataFrame для достижения ускорений, значительно превышающих обычные итерации ...

2 ответа

Хороший способ запомнить! :)

орая математическая концепция средней школы была забыта, поэтому я спрашиваю здесь. Если у меня есть два очкаp1(x1,y1), p2(x2,y2)направлениеP1-->p2, этоp1 указывает наp2, Чтобы представить это направление вектором, этоVector(x2-x1,y2-y1) ...

3 ответа

И это будет содержать все элементы решения. Если вы просто пытаетесь получить доступ к x_hist экземпляра, вы правы для доступа через m1.x_hist, но вам, вероятно, не следует использовать переменные класса, если в этом нет необходимости.

езагроможденная версияэто [https://stackoverflow.com/questions/54982411/appending-to-an-array-in-a-loop-python?noredirect=1#comment96723290_54982411] вопрос. Поскольку я так сильно изменился, я задал новый вопрос Я пытаюсь взять определенные ...