Condividi tramite


_mm256_maddsub_ps

È necessario Visual Studio 2010 SP1.

Specifici di Microsoft

Genera l'istruzione FMA4 YMM vfmaddsubps per eseguire una funzione alternata multiply-add/subtract a virgola mobile con un unico arrotondamento delle origini.

__m256 _mm256_maddsub_ps (
   __m256 src1,
   __m256 src2,
   __m256 src3
);

Parametri

  • [in] src1
    Parametro a 256 bit che contiene otto valori a virgola mobile a 32 bit.

  • [in] src2
    Parametro a 256 bit che contiene otto valori a virgola mobile a 32 bit.

  • [in] src3
    Parametro a 256 bit che contiene otto valori a virgola mobile a 32 bit.

Valore restituito

Risultato a 256 bit r che contiene otto valori a virgola mobile a 32 bit.

r[i] := src1[i] * src2[i] - src3[i]; // i even
r[i] := src1[i] * src2[i] + src3[i]; // i odd

Requisiti

Intrinseco

Architettura

_mm256_maddsub_ps

FMA4

File di intestazione <intrin.h>

Note

Ognuno degli otto valori a virgola mobile a precisione singola in src1 viene moltiplicato per il valore corrispondente in src2. Ogni valore di origine pari src3 viene sottratto dal prodotto corrispondente, ogni valore dispari viene aggiunto al prodotto corrispondente e ogni risultato viene archiviato come valore corrispondente nella destinazione. Ogni coppia multiply-add/subtract viene eseguita con un unico arrotondamento alla fine, come se i risultati intermedi venissero calcolati a precisione infinita.

L'istruzione vfmaddsubps è parte della famiglia FMA4 di istruzioni. Prima di utilizzare questo intrinseco, è necessario assicurarsi che il processore supporti questa istruzione. Per determinare il supporto hardware per questa istruzione, chiamare l'intrinseco __cpuid con InfoType = 0x80000001 e il bit di controllo 16 di CPUInfo[2] (ECX). Questo bit è 1 quando l'istruzione è supportata, e 0 in caso contrario.

Esempio

#include <stdio.h>
#include <intrin.h>
int main()
{
    __m256 a, b, c, d;
    int i;
    for (i = 0; i < 8; i++) {
        a.m256_f32[i] = i;
        b.m256_f32[i] = 2.;
        c.m256_f32[i] = 3.;
    }
    d = _mm256_maddsub_ps(a, b, c);
    for (i = 0; i < 8; i++) printf_s(" %.3f", d.m256_f32[i]);
    printf_s("\n");
}
  

Vedere anche

Riferimenti

__cpuid, __cpuidex

Altre risorse

_mm_maddsub_ps

_mm256_msubadd_ps

_mm256_maddsub_pd

Oggetti intrinseci FMA4 aggiunti per Visual Studio 2010 SP1

Cronologia delle modifiche

Data

Cronologia

Motivo

Marzo 2011

È stato aggiunto questo contenuto.

Modifica di funzionalità in SP1.