_mm256_maddsub_pd

發行項
08/12/2011

更新：2011 年 3 月

必須有 Visual Studio 2010 SP1。

Microsoft 專有的

產生 FMA4 YMM 指令 vfmaddsubpd，以執行其來源的單輪交替浮點數積和/差運算。

__m256d _mm256_maddsub_pd (
   __m256d src1,
   __m256d src2,
   __m256d src3
);

參數

[in] src1
256 位元參數，這個參數包含四個 64 位元浮點數值。
[in] src2
256 位元參數，這個參數包含四個 64 位元浮點數值。
[in] src3
256 位元參數，這個參數包含四個 64 位元浮點數值。

傳回值

256 位元結果 r，這個結果包含四個 64 位元浮點數值。

r[i] := src1[i] * src2[i] - src3[i]; // i even
r[i] := src1[i] * src2[i] + src3[i]; // i odd

需求

內建	架構
_mm256_maddsub_pd	FMA4

標頭檔 <intrin.h>

備註

將 src1 中四個雙精確度浮點數值的每個值乘以 src2 中的對應值。 src3 的每個偶數索引的來源值減去其對應的乘積，每個奇數編號值再與其對應的乘積相加，然後每個結果儲存為目的地中的對應值。每一對積和/差運算僅在執行末尾進行一次四捨五入，就好像中間結果是計算為無限的精確度。

vfmaddsubps 指令屬於 FMA4 指令家族的一部分。在使用這個內建之前，您必須先確定處理器支援這個指令。若要判斷這個指令的硬體支援，請指定 InfoType = 0x80000001 以呼叫 __cpuid 內建，並檢查 CPUInfo[2] (ECX) 的位元 16。當支援指令時，這個位元為 1，否則為 0。

範例

#include <stdio.h>
#include <intrin.h>
int main()
{
    __m256d a, b, c, d;
    int i;
    for (i = 0; i < 4; i++) {
        a.m256d_f64[i] = i;
        b.m256d_f64[i] = 2.;
        c.m256d_f64[i] = 3.;
    }
    d = _mm256_maddsub_pd(a, b, c);
    for (i = 0; i < 4; i++) printf_s(" %.3lf", d.m256d_f64[i]);
    printf_s("\n");
}