_mm256_permute2_pd

發行項
08/12/2011

更新：2011 年 3 月

必須有 Visual Studio 2010 SP1。

Microsoft 專有的

產生 XOP YMM 指令 vpermil2pd，從前兩個來源中選取浮點數值，並選擇性歸零。

__m256 _mm_permute2_pd (
   __m256d src1,
   __m256d src2,
   __m256i selector,
   int control
);

參數

[in] src1
256 位元參數，這個參數包含四個 64 位元浮點數值。
[in] src2
256 位元參數，這個參數包含四個 64 位元浮點數值。
[in] selector
256 位元參數，這個參數包含四個 64 位元浮點數值。
[in] control
32 位元整數參數，這個參數控制決定是否將結果值歸零的方法。

傳回值

256 位元結果 r，這個結果包含四個 64 位元浮點數值。

結果的高序位 128 位元中的每個值若不是零，就是從 src1 與 src2 高序位 128 位元的兩個 64 位元浮點數值中所選取的值。結果的低序位 128 位元中的每個值若不是零，就是從 src1 與 src2 低序位 128 位元的兩個 64 位元浮點數值中所選取的值。

需求

內建	架構
_mm256_permute2_pd	XOP

標頭檔 <intrin.h>

備註

在 selector 的高序位 128 位元中，其兩個 Quadword 的每一項都會從來自 src1和 src2 之高序位 128 位元的四個 64 位元浮點數值中的一個結果上選取其對應 Quadword 的值。視 control 的值和 selector Quadword 位元 3 的值而定，將這個值寫入結果之前，可能會以零取代該值。同樣的，在 selector 的低序位 128 位元中，其兩個 Quadword 的每一項都會從 src1和 src2 之低序位 128 位元的四個 64 位元浮點數值中選取一個值，而這個值也可能以零來取代。

在 selector 高序位 128 位元的每個 Quadword 中，第二個和第三個低序位位元會選取 src1 或 src2 的其中一個浮點值，0 到 1 的值表示選取 src1[2] 到 src1[3]，而 2 到 3 的值則選取 src2[2] 到 src2[3] 在 selector 低序位 128 位元的每個 Quadword 中，第二個和第三個低序位位元會選取 src1 或 src2 的其中一個浮點值，0 到 1 的值表示選取 src1[0] 到 src1[1]，而 2 到 3 的值則選取 src2[0] 到 src2[1]

以下會將 selector 中每個 Quadword 的下一個位元稱為「匹配」位元。忽略 selector 中每個 Quadword 的最低序位位元及高序位 60 位元。

第四個來源 control 決定結果值會設為 0 的條件。 control 的值必須是 0、1、2 或 3。如果 control 是 0 或 1，選取的浮點數值會寫入目的地。如果 control 是 2，則選取的浮點數值會在 selector 中的對應比對位元為 0 時寫入目的地，但是比對位元為 1 時，則寫入零。如果 control 是 3，則選取的浮點數值會在對應的比對位元為 1 時寫入目的地，但是比對位元為 0 時，則寫入零。

vpermil2pd 指令屬於 XOP 指令家族的一部分。在使用這個內建之前，您必須先確定處理器支援這個指令。若要判斷這個指令的硬體支援，請指定 InfoType = 0x80000001 以呼叫 __cpuid 內建，並檢查 CPUInfo[2] (ECX) 的位元 11。當支援指令時，這個位元為 1，否則為 0。

範例

#include <stdio.h>
#include <intrin.h>
int main()
{
    __m256d a, b, d;
    __m256i select;
    int i;
    for (i = 0; i < 4; i++) {
        a.m256d_f64[i] = i;
        b.m256d_f64[i] = i + 4;
    }
    select.m256i_i64[0] = 2 << 1;
    select.m256i_i64[1] = (1 << 1) + 8; // turn on match bit
    select.m256i_i64[2] = 0 << 1;
    select.m256i_i64[3] = (3 << 1) + 8; // turn on match bit

    
    d = _mm256_permute2_pd(a, b, select, 0); // just select, don't zero
    printf_s("%.3lf %.3lf %.3lf %.3lf\n", d.m256d_f64[0],
             d.m256d_f64[1], d.m256d_f64[2], d.m256d_f64[3]);
    d = _mm256_permute2_pd(a, b, select, 2); // zero if match is 1
    printf_s("%.3lf %.3lf %.3lf %.3lf\n", d.m256d_f64[0],
             d.m256d_f64[1], d.m256d_f64[2], d.m256d_f64[3]);
    d = _mm256_permute2_pd(a, b, select, 3); // zero if match is 0
    printf_s("%.3lf %.3lf %.3lf %.3lf\n", d.m256d_f64[0],
             d.m256d_f64[1], d.m256d_f64[2], d.m256d_f64[3]);
}

請參閱

參考

__cpuid, __cpuidex

其他資源

_mm256_permute2_ps

_mm_permute2_pd

針對 Visual Studio 2010 SP1 加入的 XOP 內建

變更記錄

日期	記錄	原因
2011 年 3 月	新增此內容。	SP1 功能變更。

2011 年 3 月

新增此內容。

SP1 功能變更。

共用方式為

_mm256_permute2_pd

參數

傳回值

需求

備註

範例

請參閱

參考

其他資源

變更記錄

其他資源