_mm256_permute2_ps
È necessario Visual Studio 2010 SP1.
Specifici di Microsoft
Genera istruzione XOP YMM vpermil2ps per selezionare valori a virgola mobile dalle prime due origini, con azzeramento facoltativo.
__m256 _mm_permute2_ps (
__m256 src1,
__m256 src2,
__m256i selector,
int control
);
Parametri
[in] src1
Parametro a 256 bit che contiene otto valori a virgola mobile a 32 bit.[in] src2
Parametro a 256 bit che contiene otto valori a virgola mobile a 32 bit.[in] selector
Parametro a 256 bit che contiene otto valori del selettore Integer a 32 bit.[in] control
Un parametro dell'intero a 32 bit che controlla il metodo per decidere se annullare i valori nel risultato.
Valore restituito
Risultato a 256 bit r che contiene otto valori a virgola mobile a 32 bit.
Ogni valore nei 128 bit più significativi del risultato è zero o un valore scelto dai quattro valori a virgola mobile a 32 bit nei 128 bit più significativi di src1 e src2. Ogni valore nei 128 bit meno significativi del risultato è zero o un valore scelto dai quattro valori a virgola mobile a 32 bit nei 128 bit meno significativi di src1 e src2.
Requisiti
Intrinseco |
Architettura |
---|---|
_mm256_permute2_ps |
XOP |
File di intestazione <intrin.h>
Note
Ognuna delle quattro parole doppie nei 128 bit più significativi di selector seleziona il valore per la parola doppia corrispondente del risultato da uno degli otto valori a virgola mobile a 32 bit nei 128 bit più significativi di src1 e src2. È possibile che questo valore venga sostituito dallo zero prima di essere scritto nel risultato, a seconda del valore di control e del valore del bit 3 della parola doppia selector. Analogamente, ognuna delle quattro parole doppie nei 128 bit meno significativi di selector seleziona un valore da uno degli otto valori a virgola mobile a 32 bit nei 128 bit meno significativi di src1 e src2 ed è inoltre possibile che questo valore venga sostituito da zero.
Per ciascuna parola doppia nei 128 bit più significativi di selector, i tre bit meno significativi selezionano uno dei valori a virgola mobile in src1 o src2, con valori da 0 a 3 selezionando da src1 [4] a src1 [7] e valori da 4 a 7 selezionando da src2 [4] a src2 [7]. Per ciascuna parola doppia nei 128 bit meno significativi selector, i tre bit meno significativi selezionano uno dei valori a virgola mobile in src1 o src2, con valori da 0 a 3 selezionando da src1 [0] a src1 [3] e valori da 4 a 7 selezionando da src2 [0] a src2 [3].
Il bit successivo di ogni parola doppia in selector sarà di seguito definito come il bit della "corrispondenza." I 28 bit più significativi di ogni parola doppia in selector vengono ignorati.
La quarta origine, control, determina le condizioni secondo le quali i valori del risultato saranno impostati su 0. Il valore di control deve essere 0, 1, 2 o 3. Se control è 0 o 1, il valore a virgola mobile selezionato è scritto nella destinazione. Se control è 2, allora il valore a virgola mobile selezionato è scritto nella destinazione se il bit della corrispondenza corrispondente in selector è 0, ma lo zero è scritto se il bit della corrispondenza è 1. Se control è 3, allora il valore a virgola mobile selezionato è scritto nella destinazione se il bit della corrispondenza corrispondente è 1, ma lo zero è scritto se il bit della corrispondenza è 0.
L'istruzione vpermil2ps è parte della famiglia XOP di istruzioni. Prima di utilizzare questo intrinseco, è necessario assicurarsi che il processore supporti questa istruzione. Per determinare il supporto hardware per questa istruzione, chiamare l'intrinseco __cpuid con InfoType = 0x80000001 e il bit di controllo 11 di CPUInfo[2] (ECX). Questo bit è 1 quando l'istruzione è supportata, e 0 in caso contrario.
Esempio
#include <stdio.h>
#include <intrin.h>
int main()
{
__m256 a, b, d;
__m256i select;
int i;
for (i = 0; i < 8; i++) {
a.m256_f32[i] = i;
b.m256_f32[i] = i+8;
}
select.m256i_i32[0] = 5;
select.m256i_i32[1] = 1 + 8; // turn on match bit
select.m256i_i32[2] = 2;
select.m256i_i32[3] = 6 + 8; // turn on match bit
select.m256i_i32[4] = 5 + 8; // turn on match bit
select.m256i_i32[5] = 1;
select.m256i_i32[6] = 2 + 8; // turn on match bit
select.m256i_i32[7] = 6;
d = _mm256_permute2_ps(a, b, select, 0); // just select, don't zero
for (i = 0; i < 8; i++) printf_s(" %6.3f", d.m256_f32[i]);
printf_s("\n");
d = _mm256_permute2_ps(a, b, select, 2); // zero if match is 1
for (i = 0; i < 8; i++) printf_s(" %6.3f", d.m256_f32[i]);
printf_s("\n");
d = _mm256_permute2_ps(a, b, select, 3); // zero if match is 0
for (i = 0; i < 8; i++) printf_s(" %6.3f", d.m256_f32[i]);
printf_s("\n");
}
Vedere anche
Riferimenti
Altre risorse
Oggetti intrinseci XOP aggiunti per Visual Studio 2010 SP1
Cronologia delle modifiche
Data |
Cronologia |
Motivo |
---|---|---|
Marzo 2011 |
È stato aggiunto questo contenuto. |
Modifica di funzionalità in SP1. |