Resultados da pesquisa a pedido "simd"
Contagem populacional mais rápida de 64 bits (peso de Hamming)
Eu tive que calcular o peso de Hamming para um fluxo contínuo muito rápido de dados de 64 bits e usando opopcnt As instruções de montagem lançam uma exceção para o meu Intel Core i7-4650U. Eu verifiquei o prazer da minha bíblia Hacker e examinei ...
prático BigNum AVX / SSE possível?
Os registros SSE / AVX podem ser vistos como BigNums de ponto flutuante ou inteiro. Ou seja, pode-se negligenciar a existência de pistas. Existe uma maneira fácil de explorar esse ponto de vista e usar esses registros como BigNums individualmente ...
Qual é a diferença entre intrínsecas lógicas do SSE?
Existe alguma diferença entre intrínsecas lógicas do SSE para tipos diferentes? Por exemplo, se usarmos a operação OR, existem três intrínsecos: _mm_or_ps, _mm_or_pd e _mm_or_si128, os quais fazem a mesma coisa: computarbit a bit OU de seus ...
Todas as arquiteturas intel de 64 bits são compatíveis com as instruções SSSE3 / SSE4.1 / SSE4.2?
Eu pesquisei na web emanual do software intel [http://www.intel.com/Assets/ja_JP/PDF/manual/253665.pdf]. Mas não consigo confirmar se todas as arquiteturas Intel 64 suportam SSSE3 ou SSE4.1 ou SSE4.2 ou AVX etc. Para que eu possa usar as ...
Bitmap uint8_t ideal em um vetor "bool" SIMD de 8 x 32 bits
Como parte de um algoritmo de compactação, estou procurando a maneira ideal de obter o seguinte: Eu tenho um bitmap simples em umuint8_t. Por exemplo 01010011 O que eu quero é um__m256i do formulário: (0, maxint, 0, maxint, 0, 0, ...
Intel SIMD - Como posso verificar se um __m256 * contém valores diferentes de zero
Estou usando o compilador Microsoft Visual Studio. Estou tentando descobrir se um vetor de 256 bits contém valores diferentes de zero. eu tenteires_simd = ! _mm256_testz_ps(*pSrc1, *pSrc1); mas não funciona.
Verificando se o SSE é suportado no tempo de execução [duplicado]
Esta pergunta já tem uma resposta aqui: Como verificar se uma CPU suporta o conjunto de instruções SSE3? [/questions/6121792/how-to-check-if-a-cpu-supports-the-sse3-instruction-set] 5 respostasdespachante cpu para visual studio para AVX e ...
CUDA: Evitando execução serial na divergência de ramificação
Suponha que um núcleo CUDA executado por um único warp (por simplicidade) atinja umif-else declaração, onde 20 dos threads dentro do warp satisfazemcondition e 32 - 20 = 12 threads não: if (condition){ statement1; // executed by 20 threads else{ ...
Intrínsecas Constexpr e SSE
A maioria dos compiladores C ++ oferece suporte a instruções SIMD (SSE / AVX) com recursos como _mm_cmpeq_epi32Meu problema com isso é que essa função não está marcada comoconstexpr, embora "semanticamente" não haja motivo para essa função ...
Problema de alinhamento SIMD com PPL Combinável
Estou tentando somar os elementos da matriz em paralelo com o SIMD. Para evitar o bloqueio, estou usando o encadeamento local combinável, que nem sempre está alinhado em 16 bytes, porque _mm_add_epi32 está lançando uma ...