Resultados da pesquisa a pedido "simd"

2 a resposta

Contagem populacional mais rápida de 64 bits (peso de Hamming)

Eu tive que calcular o peso de Hamming para um fluxo contínuo muito rápido de dados de 64 bits e usando opopcnt As instruções de montagem lançam uma exceção para o meu Intel Core i7-4650U. Eu verifiquei o prazer da minha bíblia Hacker e examinei ...

3 a resposta

prático BigNum AVX / SSE possível?

Os registros SSE / AVX podem ser vistos como BigNums de ponto flutuante ou inteiro. Ou seja, pode-se negligenciar a existência de pistas. Existe uma maneira fácil de explorar esse ponto de vista e usar esses registros como BigNums individualmente ...

3 a resposta

Qual é a diferença entre intrínsecas lógicas do SSE?

Existe alguma diferença entre intrínsecas lógicas do SSE para tipos diferentes? Por exemplo, se usarmos a operação OR, existem três intrínsecos: _mm_or_ps, _mm_or_pd e _mm_or_si128, os quais fazem a mesma coisa: computarbit a bit OU de seus ...

1 a resposta

Todas as arquiteturas intel de 64 bits são compatíveis com as instruções SSSE3 / SSE4.1 / SSE4.2?

Eu pesquisei na web emanual do software intel [http://www.intel.com/Assets/ja_JP/PDF/manual/253665.pdf]. Mas não consigo confirmar se todas as arquiteturas Intel 64 suportam SSSE3 ou SSE4.1 ou SSE4.2 ou AVX etc. Para que eu possa usar as ...

3 a resposta

Bitmap uint8_t ideal em um vetor "bool" SIMD de 8 x 32 bits

Como parte de um algoritmo de compactação, estou procurando a maneira ideal de obter o seguinte: Eu tenho um bitmap simples em umuint8_t. Por exemplo 01010011 O que eu quero é um__m256i do formulário: (0, maxint, 0, maxint, 0, 0, ...

1 a resposta

Intel SIMD - Como posso verificar se um __m256 * contém valores diferentes de zero

Estou usando o compilador Microsoft Visual Studio. Estou tentando descobrir se um vetor de 256 bits contém valores diferentes de zero. eu tenteires_simd = ! _mm256_testz_ps(*pSrc1, *pSrc1); mas não funciona.

2 a resposta

Verificando se o SSE é suportado no tempo de execução [duplicado]

Esta pergunta já tem uma resposta aqui: Como verificar se uma CPU suporta o conjunto de instruções SSE3? [/questions/6121792/how-to-check-if-a-cpu-supports-the-sse3-instruction-set] 5 respostasdespachante cpu para visual studio para AVX e ...

1 a resposta

CUDA: Evitando execução serial na divergência de ramificação

Suponha que um núcleo CUDA executado por um único warp (por simplicidade) atinja umif-else declaração, onde 20 dos threads dentro do warp satisfazemcondition e 32 - 20 = 12 threads não: if (condition){ statement1; // executed by 20 threads else{ ...

1 a resposta

Intrínsecas Constexpr e SSE

A maioria dos compiladores C ++ oferece suporte a instruções SIMD (SSE / AVX) com recursos como _mm_cmpeq_epi32Meu problema com isso é que essa função não está marcada comoconstexpr, embora "semanticamente" não haja motivo para essa função ...

2 a resposta

Problema de alinhamento SIMD com PPL Combinável

Estou tentando somar os elementos da matriz em paralelo com o SIMD. Para evitar o bloqueio, estou usando o encadeamento local combinável, que nem sempre está alinhado em 16 bytes, porque _mm_add_epi32 está lançando uma ...