Condividi tramite


_mm256_permute2_ps

È necessario Visual Studio 2010 SP1.

Specifici di Microsoft

Genera istruzione XOP YMM vpermil2ps per selezionare valori a virgola mobile dalle prime due origini, con azzeramento facoltativo.

__m256 _mm_permute2_ps (
   __m256 src1,
   __m256 src2,
   __m256i selector,
   int control
); 

Parametri

  • [in] src1
    Parametro a 256 bit che contiene otto valori a virgola mobile a 32 bit.

  • [in] src2
    Parametro a 256 bit che contiene otto valori a virgola mobile a 32 bit.

  • [in] selector
    Parametro a 256 bit che contiene otto valori del selettore Integer a 32 bit.

  • [in] control
    Un parametro dell'intero a 32 bit che controlla il metodo per decidere se annullare i valori nel risultato.

Valore restituito

Risultato a 256 bit r che contiene otto valori a virgola mobile a 32 bit.

Ogni valore nei 128 bit più significativi del risultato è zero o un valore scelto dai quattro valori a virgola mobile a 32 bit nei 128 bit più significativi di src1 e src2. Ogni valore nei 128 bit meno significativi del risultato è zero o un valore scelto dai quattro valori a virgola mobile a 32 bit nei 128 bit meno significativi di src1 e src2.

Requisiti

Intrinseco

Architettura

_mm256_permute2_ps

XOP

File di intestazione <intrin.h>

Note

Ognuna delle quattro parole doppie nei 128 bit più significativi di selector seleziona il valore per la parola doppia corrispondente del risultato da uno degli otto valori a virgola mobile a 32 bit nei 128 bit più significativi di src1 e src2. È possibile che questo valore venga sostituito dallo zero prima di essere scritto nel risultato, a seconda del valore di control e del valore del bit 3 della parola doppia selector. Analogamente, ognuna delle quattro parole doppie nei 128 bit meno significativi di selector seleziona un valore da uno degli otto valori a virgola mobile a 32 bit nei 128 bit meno significativi di src1 e src2 ed è inoltre possibile che questo valore venga sostituito da zero.

Per ciascuna parola doppia nei 128 bit più significativi di selector, i tre bit meno significativi selezionano uno dei valori a virgola mobile in src1 o src2, con valori da 0 a 3 selezionando da src1 [4] a src1 [7] e valori da 4 a 7 selezionando da src2 [4] a src2 [7]. Per ciascuna parola doppia nei 128 bit meno significativi selector, i tre bit meno significativi selezionano uno dei valori a virgola mobile in src1 o src2, con valori da 0 a 3 selezionando da src1 [0] a src1 [3] e valori da 4 a 7 selezionando da src2 [0] a src2 [3].

Il bit successivo di ogni parola doppia in selector sarà di seguito definito come il bit della "corrispondenza." I 28 bit più significativi di ogni parola doppia in selector vengono ignorati.

La quarta origine, control, determina le condizioni secondo le quali i valori del risultato saranno impostati su 0. Il valore di control deve essere 0, 1, 2 o 3. Se control è 0 o 1, il valore a virgola mobile selezionato è scritto nella destinazione. Se control è 2, allora il valore a virgola mobile selezionato è scritto nella destinazione se il bit della corrispondenza corrispondente in selector è 0, ma lo zero è scritto se il bit della corrispondenza è 1. Se control è 3, allora il valore a virgola mobile selezionato è scritto nella destinazione se il bit della corrispondenza corrispondente è 1, ma lo zero è scritto se il bit della corrispondenza è 0.

L'istruzione vpermil2ps è parte della famiglia XOP di istruzioni. Prima di utilizzare questo intrinseco, è necessario assicurarsi che il processore supporti questa istruzione. Per determinare il supporto hardware per questa istruzione, chiamare l'intrinseco __cpuid con InfoType = 0x80000001 e il bit di controllo 11 di CPUInfo[2] (ECX). Questo bit è 1 quando l'istruzione è supportata, e 0 in caso contrario.

Esempio

#include <stdio.h>
#include <intrin.h>
int main()
{
    __m256 a, b, d;
    __m256i select;
    int i;
    for (i = 0; i < 8; i++) {
        a.m256_f32[i] = i;
        b.m256_f32[i] = i+8;
    }
    select.m256i_i32[0] = 5;
    select.m256i_i32[1] = 1 + 8; // turn on match bit
    select.m256i_i32[2] = 2;
    select.m256i_i32[3] = 6 + 8; // turn on match bit
    select.m256i_i32[4] = 5 + 8; // turn on match bit
    select.m256i_i32[5] = 1;
    select.m256i_i32[6] = 2 + 8; // turn on match bit
    select.m256i_i32[7] = 6;

    d = _mm256_permute2_ps(a, b, select, 0); // just select, don't zero
    for (i = 0; i < 8; i++) printf_s(" %6.3f", d.m256_f32[i]);
    printf_s("\n");
    d = _mm256_permute2_ps(a, b, select, 2); // zero if match is 1
    for (i = 0; i < 8; i++) printf_s(" %6.3f", d.m256_f32[i]);
    printf_s("\n");
    d = _mm256_permute2_ps(a, b, select, 3); // zero if match is 0
    for (i = 0; i < 8; i++) printf_s(" %6.3f", d.m256_f32[i]);
    printf_s("\n");
}
  

Vedere anche

Riferimenti

__cpuid, __cpuidex

Altre risorse

_mm256_permute2_pd

_mm_permute2_ps

Oggetti intrinseci XOP aggiunti per Visual Studio 2010 SP1

Cronologia delle modifiche

Data

Cronologia

Motivo

Marzo 2011

È stato aggiunto questo contenuto.

Modifica di funzionalità in SP1.