_mm256_permute2_pd
È necessario Visual Studio 2010 SP1.
Specifici di Microsoft
Genera istruzione XOP YMM vpermil2pd per selezionare valori a virgola mobile dalle prime due origini, con azzeramento facoltativo.
__m256 _mm_permute2_pd (
__m256d src1,
__m256d src2,
__m256i selector,
int control
);
Parametri
[in] src1
Parametro a 256 bit che contiene quattro valori a virgola mobile a 64 bit.[in] src2
Parametro a 256 bit che contiene quattro valori a virgola mobile a 64 bit.[in] selector
Parametro a 256 bit che contiene quattro valori a virgola mobile a 64 bit.[in] control
Un parametro dell'intero a 32 bit che controlla il metodo per decidere se annullare i valori nel risultato.
Valore restituito
Risultato a 256 bit r che contiene quattro valori a virgola mobile a 64 bit.
Ogni valore nei 128 bit più significativi del risultato è zero o un valore scelto dai due valori a virgola mobile a 64 bit nei 128 bit più significativi di src1 e src2. Ogni valore nei 128 bit meno significativi del risultato è zero o un valore scelto dai due valori a virgola mobile a 64 bit nei 128 bit meno significativi di src1 e src2.
Requisiti
Intrinseco |
Architettura |
---|---|
_mm256_permute2_pd |
XOP |
File di intestazione <intrin.h>
Note
Ognuna delle due parole quadruple nei 128 bit più significativi di selector seleziona il valore per la parola quadrupla corrispondente del risultato da uno dei quattro valori a virgola mobile a 64 bit nei 128 bit più significativi di src1 e src2. È possibile che questo valore venga sostituito dallo zero prima di essere scritto nel risultato, a seconda del valore di control e del valore del bit 3 della parola quadrupla selector. Analogamente, ognuna delle due parole quadruple nei 128 bit meno significativi di selector seleziona un valore da uno dei quattro valori a virgola mobile a 64 bit nei 128 bit meno significativi di src1 e src2 ed è inoltre possibile che questo valore venga sostituito da zero.
Per ciascuna parola quadrupla nei 128 bit più significativi selector, il secondo e il terzo bit meno significativi selezionano uno dei valori a virgola mobile in src1 o src2, con valori da 0 a 1 selezionando da src1[2] a src1[3] e valori da 2 a 3 selezionando da src [2] a src2[3]. Per ciascuna parola quadrupla nei 128 bit meno significativi selector, il secondo e il terzo bit meno significativi selezionano uno dei valori a virgola mobile in src1 o src2, con valori da 0 a 1 selezionando da src1 [0] a src1[1] e valori da 2 a 3 selezionando da src2 [0] a src2 [1].
Il bit successivo di ogni parola quadrupla nel selector sarà di seguito definito come il bit della "corrispondenza." Il bit poco significativo ed i 60 bit più significativi di ogni parola quadrupla nel selector vengono ignorati.
La quarta origine, control, determina le condizioni secondo le quali i valori del risultato saranno impostati su 0. Il valore di control deve essere 0, 1, 2 o 3. Se control è 0 o 1, il valore a virgola mobile selezionato è scritto nella destinazione. Se control è 2, allora il valore a virgola mobile selezionato è scritto nella destinazione se il bit della corrispondenza corrispondente in selector è 0, ma lo zero è scritto se il bit della corrispondenza è 1. Se control è 3, allora il valore a virgola mobile selezionato è scritto nella destinazione se il bit della corrispondenza corrispondente è 1, ma lo zero è scritto se il bit della corrispondenza è 0.
L'istruzione vpermil2pd è parte della famiglia XOP di istruzioni. Prima di utilizzare questo intrinseco, è necessario assicurarsi che il processore supporti questa istruzione. Per determinare il supporto hardware per questa istruzione, chiamare l'intrinseco __cpuid con InfoType = 0x80000001 e il bit di controllo 11 di CPUInfo[2] (ECX). Questo bit è 1 quando l'istruzione è supportata, e 0 in caso contrario.
Esempio
#include <stdio.h>
#include <intrin.h>
int main()
{
__m256d a, b, d;
__m256i select;
int i;
for (i = 0; i < 4; i++) {
a.m256d_f64[i] = i;
b.m256d_f64[i] = i + 4;
}
select.m256i_i64[0] = 2 << 1;
select.m256i_i64[1] = (1 << 1) + 8; // turn on match bit
select.m256i_i64[2] = 0 << 1;
select.m256i_i64[3] = (3 << 1) + 8; // turn on match bit
d = _mm256_permute2_pd(a, b, select, 0); // just select, don't zero
printf_s("%.3lf %.3lf %.3lf %.3lf\n", d.m256d_f64[0],
d.m256d_f64[1], d.m256d_f64[2], d.m256d_f64[3]);
d = _mm256_permute2_pd(a, b, select, 2); // zero if match is 1
printf_s("%.3lf %.3lf %.3lf %.3lf\n", d.m256d_f64[0],
d.m256d_f64[1], d.m256d_f64[2], d.m256d_f64[3]);
d = _mm256_permute2_pd(a, b, select, 3); // zero if match is 0
printf_s("%.3lf %.3lf %.3lf %.3lf\n", d.m256d_f64[0],
d.m256d_f64[1], d.m256d_f64[2], d.m256d_f64[3]);
}
Vedere anche
Riferimenti
Altre risorse
Oggetti intrinseci XOP aggiunti per Visual Studio 2010 SP1
Cronologia delle modifiche
Data |
Cronologia |
Motivo |
---|---|---|
Marzo 2011 |
È stato aggiunto questo contenuto. |
Modifica di funzionalità in SP1. |