共用方式為


_mm_macc_ss

更新:2011 年 3 月

必須有 Visual Studio 2010 SP1。

Microsoft 專有的

產生 FMA4 XMM 指令 vfmaddss,以執行其來源之低序位浮點數值的單輪浮點數積和運算。

__m128 _mm_macc_ss (
   __m128 src1,
   __m128 src2,
   __m128 src3
); 

參數

  • [in] src1
    128 位元參數,這個參數的低序位 Doubleword 包含 32 位元浮點數值。

  • [in] src2
    128 位元參數,這個參數的低序位 Doubleword 包含 32 位元浮點數值。

  • [in] src3
    128 位元參數,這個參數的低序位 Doubleword 包含 32 位元浮點數值。

傳回值

128 位元結果 r,這個結果包含四個 32 位元浮點數值。

r[0] := src1[0] * src2[0] + src3[0];
r[1] := r[2] = r[3] = 0.;

需求

內建

架構

_mm_macc_ss

FMA4

標頭檔 <intrin.h>

備註

src1 中的低序位單精確度浮點值乘以 src2 中對應的值,再與 src3 中對應的值相加,然後結果會儲存為目的地中的相對應值。src1、src2 和 src3 中的其他值會被忽略,而結果的三個高序位浮點數值則設為 0。 積和運算僅在執行末尾進行一次四捨五入,就好像中間結果是計算為無限的精確度。

vfmaddss 指令屬於 FMA4 指令家族的一部分。 在使用這個內建之前,您必須先確定處理器支援這個指令。 若要判斷這個指令的硬體支援,請指定 InfoType = 0x80000001 以呼叫 __cpuid 內建,並檢查 CPUInfo[2] (ECX) 的位元 16。 當支援指令時,這個位元為 1,否則為 0。

範例

#include <stdio.h>
#include <intrin.h>
int main()
{
    __m128 a, b, c, d;
    int i;
    for (i = 0; i < 4; i++) {
        a.m128_f32[i] = i;
        b.m128_f32[i] = 2.;
        c.m128_f32[i] = 3.;
    }
    d = _mm_macc_ss(a, b, c);
    for (i = 0; i < 4; i++) printf_s(" %.3f", d.m128_f32[i]);
    printf_s("\n");
}
  

請參閱

參考

__cpuid, __cpuidex

其他資源

_mm256_macc_ps

_mm_macc_ps

_mm_macc_sd

_mm_nmacc_ss

_mm_msub_ss

_mm_nmsub_ss

針對 Visual Studio 2010 SP1 加入的 FMA4 內建

變更記錄

日期

記錄

原因

2011 年 3 月

新增此內容。

SP1 功能變更。