Resultados da pesquisa a pedido "avx"

2 a resposta

Contagem populacional mais rápida de 64 bits (peso de Hamming)

Eu tive que calcular o peso de Hamming para um fluxo contínuo muito rápido de dados de 64 bits e usando opopcnt As instruções de montagem lançam uma exceção para o meu Intel Core i7-4650U. Eu verifiquei o prazer da minha bíblia Hacker e examinei ...

3 a resposta

prático BigNum AVX / SSE possível?

Os registros SSE / AVX podem ser vistos como BigNums de ponto flutuante ou inteiro. Ou seja, pode-se negligenciar a existência de pistas. Existe uma maneira fácil de explorar esse ponto de vista e usar esses registros como BigNums individualmente ...

3 a resposta

Bitmap uint8_t ideal em um vetor "bool" SIMD de 8 x 32 bits

Como parte de um algoritmo de compactação, estou procurando a maneira ideal de obter o seguinte: Eu tenho um bitmap simples em umuint8_t. Por exemplo 01010011 O que eu quero é um__m256i do formulário: (0, maxint, 0, maxint, 0, 0, ...

1 a resposta

Intel SIMD - Como posso verificar se um __m256 * contém valores diferentes de zero

Estou usando o compilador Microsoft Visual Studio. Estou tentando descobrir se um vetor de 256 bits contém valores diferentes de zero. eu tenteires_simd = ! _mm256_testz_ps(*pSrc1, *pSrc1); mas não funciona.

2 a resposta

Verificando se o SSE é suportado no tempo de execução [duplicado]

Esta pergunta já tem uma resposta aqui: Como verificar se uma CPU suporta o conjunto de instruções SSE3? [/questions/6121792/how-to-check-if-a-cpu-supports-the-sse3-instruction-set] 5 respostasdespachante cpu para visual studio para AVX e ...

1 a resposta

AVX: alinhamento de dados: falha na loja, storeu, load, loadu não

Estou modificando a RNNLM como uma rede neural para estudar o modelo de linguagem. No entanto, dado o tamanho do meu corpus, ele está correndo muito devagar. Tentei otimizar a rotina do vetor da matriz * (que é responsável por 63% do tempo total ...

1 a resposta

Wrapper para `__m256` produzindo falha de segmentação com construtor - Windows 64 + MinGW + AVX Issues

Eu tenho uma união que se parece com isso union bareVec8f { __m256 m256; //avx 8x float vector float floats[8]; int ints[8]; inline bareVec8f(){ } inline bareVec8f(__m256 vec){ this->m256 = vec; } inline bareVec8f &operator=(__m256 m256) { ...

2 a resposta

Acesso à memória alinhado e não alinhado com intrínsecas AVX / AVX2

De acordo com o Manual do desenvolvedor de software da Intel (seção 14.9), o AVX relaxou os requisitos de alinhamento dos acessos à memória. Se os dados forem carregados diretamente em uma instrução de processamento, por exemplo, vaddps ...

2 a resposta

Classificando estruturas de 64 bits usando o AVX?

Eu tenho uma estrutura de 64 bits que representa várias partes de dados, uma das quais é um valor de ponto flutuante: struct MyStruct{ uint16_t a; uint16_t b; float f; };e eu tenho quatro dessas estruturas, digamosstd::array<MyStruct, 4> é ...

1 a resposta

Quantos ciclos de clock custam exponenciação AVX / SSE na moderna CPU x86_64?

Quantos ciclos de clock custam exponenciação AVX / SSE na moderna CPU x86_64? Eu estou prestes:pow(x, y) = exp(y*log(x)) [https://stackoverflow.com/questions/25936031/pow-for-sse-types] I.e. faz ambosexp() elog() As instruções AVX x86_64 ...