Condividi tramite


_mm256_permute2_pd

È necessario Visual Studio 2010 SP1.

Specifici di Microsoft

Genera istruzione XOP YMM vpermil2pd per selezionare valori a virgola mobile dalle prime due origini, con azzeramento facoltativo.

__m256 _mm_permute2_pd (
   __m256d src1,
   __m256d src2,
   __m256i selector,
   int control
); 

Parametri

  • [in] src1
    Parametro a 256 bit che contiene quattro valori a virgola mobile a 64 bit.

  • [in] src2
    Parametro a 256 bit che contiene quattro valori a virgola mobile a 64 bit.

  • [in] selector
    Parametro a 256 bit che contiene quattro valori a virgola mobile a 64 bit.

  • [in] control
    Un parametro dell'intero a 32 bit che controlla il metodo per decidere se annullare i valori nel risultato.

Valore restituito

Risultato a 256 bit r che contiene quattro valori a virgola mobile a 64 bit.

Ogni valore nei 128 bit più significativi del risultato è zero o un valore scelto dai due valori a virgola mobile a 64 bit nei 128 bit più significativi di src1 e src2. Ogni valore nei 128 bit meno significativi del risultato è zero o un valore scelto dai due valori a virgola mobile a 64 bit nei 128 bit meno significativi di src1 e src2.

Requisiti

Intrinseco

Architettura

_mm256_permute2_pd

XOP

File di intestazione <intrin.h>

Note

Ognuna delle due parole quadruple nei 128 bit più significativi di selector seleziona il valore per la parola quadrupla corrispondente del risultato da uno dei quattro valori a virgola mobile a 64 bit nei 128 bit più significativi di src1 e src2. È possibile che questo valore venga sostituito dallo zero prima di essere scritto nel risultato, a seconda del valore di control e del valore del bit 3 della parola quadrupla selector. Analogamente, ognuna delle due parole quadruple nei 128 bit meno significativi di selector seleziona un valore da uno dei quattro valori a virgola mobile a 64 bit nei 128 bit meno significativi di src1 e src2 ed è inoltre possibile che questo valore venga sostituito da zero.

Per ciascuna parola quadrupla nei 128 bit più significativi selector, il secondo e il terzo bit meno significativi selezionano uno dei valori a virgola mobile in src1 o src2, con valori da 0 a 1 selezionando da src1[2] a src1[3] e valori da 2 a 3 selezionando da src [2] a src2[3]. Per ciascuna parola quadrupla nei 128 bit meno significativi selector, il secondo e il terzo bit meno significativi selezionano uno dei valori a virgola mobile in src1 o src2, con valori da 0 a 1 selezionando da src1 [0] a src1[1] e valori da 2 a 3 selezionando da src2 [0] a src2 [1].

Il bit successivo di ogni parola quadrupla nel selector sarà di seguito definito come il bit della "corrispondenza." Il bit poco significativo ed i 60 bit più significativi di ogni parola quadrupla nel selector vengono ignorati.

La quarta origine, control, determina le condizioni secondo le quali i valori del risultato saranno impostati su 0. Il valore di control deve essere 0, 1, 2 o 3. Se control è 0 o 1, il valore a virgola mobile selezionato è scritto nella destinazione. Se control è 2, allora il valore a virgola mobile selezionato è scritto nella destinazione se il bit della corrispondenza corrispondente in selector è 0, ma lo zero è scritto se il bit della corrispondenza è 1. Se control è 3, allora il valore a virgola mobile selezionato è scritto nella destinazione se il bit della corrispondenza corrispondente è 1, ma lo zero è scritto se il bit della corrispondenza è 0.

L'istruzione vpermil2pd è parte della famiglia XOP di istruzioni. Prima di utilizzare questo intrinseco, è necessario assicurarsi che il processore supporti questa istruzione. Per determinare il supporto hardware per questa istruzione, chiamare l'intrinseco __cpuid con InfoType = 0x80000001 e il bit di controllo 11 di CPUInfo[2] (ECX). Questo bit è 1 quando l'istruzione è supportata, e 0 in caso contrario.

Esempio

#include <stdio.h>
#include <intrin.h>
int main()
{
    __m256d a, b, d;
    __m256i select;
    int i;
    for (i = 0; i < 4; i++) {
        a.m256d_f64[i] = i;
        b.m256d_f64[i] = i + 4;
    }
    select.m256i_i64[0] = 2 << 1;
    select.m256i_i64[1] = (1 << 1) + 8; // turn on match bit
    select.m256i_i64[2] = 0 << 1;
    select.m256i_i64[3] = (3 << 1) + 8; // turn on match bit

    
    d = _mm256_permute2_pd(a, b, select, 0); // just select, don't zero
    printf_s("%.3lf %.3lf %.3lf %.3lf\n", d.m256d_f64[0],
             d.m256d_f64[1], d.m256d_f64[2], d.m256d_f64[3]);
    d = _mm256_permute2_pd(a, b, select, 2); // zero if match is 1
    printf_s("%.3lf %.3lf %.3lf %.3lf\n", d.m256d_f64[0],
             d.m256d_f64[1], d.m256d_f64[2], d.m256d_f64[3]);
    d = _mm256_permute2_pd(a, b, select, 3); // zero if match is 0
    printf_s("%.3lf %.3lf %.3lf %.3lf\n", d.m256d_f64[0],
             d.m256d_f64[1], d.m256d_f64[2], d.m256d_f64[3]);
}
  

Vedere anche

Riferimenti

__cpuid, __cpuidex

Altre risorse

_mm256_permute2_ps

_mm_permute2_pd

Oggetti intrinseci XOP aggiunti per Visual Studio 2010 SP1

Cronologia delle modifiche

Data

Cronologia

Motivo

Marzo 2011

È stato aggiunto questo contenuto.

Modifica di funzionalità in SP1.