_mm_nmacc_pd
更新:2011 年 3 月
必須有 Visual Studio 2010 SP1。
Microsoft 專有的
產生 FMA4 XMM 指令 vfnmaddpd,以執行其來源的單輪雙精確度浮點數負積和運算。
__m128d _mm_nmacc_pd (
__m128d src1,
__m128d src2,
__m128d src3
);
參數
[in] src1
128 位元參數,這個參數包含兩個 64 位元浮點數值。[in] src2
128 位元參數,這個參數包含兩個 64 位元浮點數值。[in] src3
128 位元參數,這個參數包含兩個 64 位元浮點數值。
傳回值
128 位元結果 r,這個結果包含兩個 64 位元浮點數值。
r[i] := -(src1[i] * src2[i]) + src3[i];
需求
內建 |
架構 |
---|---|
_mm_nmacc_pd |
FMA4 |
標頭檔 <intrin.h>
備註
將 src1 中兩個雙精確度浮點數值的每個值乘以 src2 中的對應值。 結果會經過負運算,並與 src3 中的對應值相加,然後結果儲存為目的地中的對應值。 每一對積和運算僅在執行末尾進行一次四捨五入,就好像中間結果是計算為無限的精確度。
vfnmaddpd 指令屬於 FMA4 指令家族的一部分。 在使用這個內建之前,您必須先確定處理器支援這個指令。 若要判斷這個指令的硬體支援,請指定 InfoType = 0x80000001 以呼叫 __cpuid 內建,並檢查 CPUInfo[2] (ECX) 的位元 16。 當支援指令時,這個位元為 1,否則為 0。
範例
#include <stdio.h>
#include <intrin.h>
int main()
{
__m128d a, b, c, d;
int i;
for (i = 0; i < 2; i++) {
a.m128d_f64[i] = i;
b.m128d_f64[i] = 2.;
c.m128d_f64[i] = 3.;
}
d = _mm_nmacc_pd(a, b, c);
for (i = 0; i < 2; i++) printf_s(" %.3lf", d.m128d_f64[i]);
printf_s("\n");
}
請參閱
參考
其他資源
針對 Visual Studio 2010 SP1 加入的 FMA4 內建
變更記錄
日期 |
記錄 |
原因 |
---|---|---|
2011 年 3 月 |
新增此內容。 |
SP1 功能變更。 |