Usando lambdas, objetos de função e funções restritas
O código AMP C++ que você deseja executar no acelerador é especificado como um argumento em uma chamada para o parallel_for_each
método. Você pode fornecer uma expressão lambda ou um objeto de função (functor) como esse argumento. Além disso, a expressão lambda ou o objeto de função podem chamar uma função restrita por AMP C++. Este tópico usa um algoritmo de adição de matriz para demonstrar lambdas, objetos de função e funções restritas. O exemplo a seguir mostra o algoritmo sem código C++ AMP. Duas matrizes unidimensionais de comprimento igual são criadas. Os elementos inteiros correspondentes são adicionados e armazenados em uma terceira matriz unidimensional. C++ AMP não é usado.
void CpuMethod() {
int aCPP[] = {1, 2, 3, 4, 5};
int bCPP[] = {6, 7, 8, 9, 10};
int sumCPP[5];
for (int idx = 0; idx <5; idx++)
{
sumCPP[idx] = aCPP[idx] + bCPP[idx];
}
for (int idx = 0; idx <5; idx++)
{
std::cout <<sumCPP[idx] <<"\n";
}
}
Expressão lambda
Usar uma expressão lambda é a maneira mais direta de usar C++ AMP para reescrever o código.
void AddArraysWithLambda() {
int aCPP[] = {1, 2, 3, 4, 5};
int bCPP[] = {6, 7, 8, 9, 10};
int sumCPP[5];
array_view<const int, 1> a(5, aCPP);
array_view<const int, 1> b(5, bCPP);
array_view<int, 1> sum(5, sumCPP);
sum.discard_data();
parallel_for_each(
sum.extent,
[=](index<1> idx) restrict(amp)
{
sum[idx] = a[idx] + b[idx];
});
for (int i = 0; i <5; i++) {
std::cout <<sum[i] <<"\n";
}
}
A expressão lambda deve incluir um parâmetro de indexação e deve incluir restrict(amp)
. No exemplo, o objeto array_viewsum
tem uma classificação de 1. Portanto, o parâmetro para a instrução lambda é um objeto índice que tem a classificação 1. Em runtime, a expressão lambda é executada uma vez para cada elemento no objeto array_view. Para mais informações, confira Sintaxe de expressão lambda.
Objeto Function
Você pode fatorar o código do acelerador em um objeto de função.
class AdditionFunctionObject
{
public:
AdditionFunctionObject(const array_view<int, 1>& a,
const array_view<int, 1>& b,
const array_view<int, 1>& sum)
: a(a), b(b), sum(sum)
{
}
void operator()(index<1> idx) restrict(amp)
{
sum[idx] = a[idx] + b[idx];
}
private:
array_view<int, 1> a;
array_view<int, 1> b;
array_view<int, 1> sum;
};
void AddArraysWithFunctionObject() {
int aCPP[] = {1, 2, 3, 4, 5};
int bCPP[] = {6, 7, 8, 9, 10};
int sumCPP[5];
array_view<const int, 1> a(5, aCPP);
array_view<const int, 1> b(5, bCPP);
array_view<int, 1> sum(5, sumCPP);
sum.discard_data();
parallel_for_each(
sum.extent,
AdditionFunctionObject(a, b, sum));
for (int i = 0; i <5; i++) {
std::cout <<sum[i] <<"\n";
}
}
O objeto de função deve incluir um construtor e uma sobrecarga do operador de chamada de função. O operador de chamada de função deve incluir um parâmetro de indexação. Uma instância do objeto de função é passada como o segundo argumento para o método parallel_for_each. Neste exemplo, três objetos array_view são passados para o construtor do objeto de função. O objeto array_viewsum
tem uma classificação de 1. Portanto, o parâmetro para o operador de chamada de função é um objeto index que tem a classificação 1. Em runtime, a função é executada uma vez para cada elemento no objeto array_view. Para obter mais informações, confira Chamada de Função e Objetos de Função na Biblioteca Padrão do C++.
Função restrita por AMP C++
Você pode fatorar ainda mais o código do acelerador criando uma função restrita e chamando-a de uma expressão lambda ou de um objeto de função. O exemplo de código a seguir demonstra como chamar uma função restrita de uma expressão lambda.
void AddElementsWithRestrictedFunction(index<1> idx, array_view<int, 1> sum, array_view<int, 1> a, array_view<int, 1> b) restrict(amp)
{
sum[idx] = a[idx] + b[idx];
}
void AddArraysWithFunction() {
int aCPP[] = {1, 2, 3, 4, 5};
int bCPP[] = {6, 7, 8, 9, 10};
int sumCPP[5];
array_view<int, 1> a(5, aCPP);
array_view<int, 1> b(5, bCPP);
array_view<int, 1> sum(5, sumCPP);
sum.discard_data();
parallel_for_each(
sum.extent,
[=](index<1> idx) restrict(amp)
{
AddElementsWithRestrictedFunction(idx, sum, a, b);
});
for (int i = 0; i <5; i++) {
std::cout <<sum[i] <<"\n";
}
}
A função restrita deve incluir restrict(amp)
e estar em conformidade com as restrições descritas em restrict (C++ AMP).
Confira também
C++ AMP (C++ Accelerated Massive Parallelism)
Sintaxe da expressão lambda
Chamada de função
Objetos de função na Biblioteca Padrão C++
restrict (C++ AMP)