Como usar combinável para melhorar o desempenho
Este exemplo mostra como usar a classe de concurrency::combinable para calcular a soma dos números em um objeto de std::array que são principais. A classe de combinable melhora o desempenho com a eliminação do estado compartilhado.
Dica
Em alguns casos, o mapa parallel (concurrency::parallel_transform) e reduce ()simultaneidade:: parallel_reducepode fornecer melhorias de desempenho sobre combinable.Para obter um exemplo que usa o mapa e reduzir as operações para produzir os mesmos resultados que esse exemplo, consulte Algoritmos paralelos.
Exemplo
O exemplo a seguir usa a função de std::accumulate para calcular a soma dos elementos em uma matriz que são principais. Neste exemplo, a é um objeto de array e a função de is_prime determina se o valor de entrada for o principal.
prime_sum = accumulate(begin(a), end(a), 0, [&](int acc, int i) {
return acc + (is_prime(i) ? i : 0);
});
O exemplo a seguir mostra uma maneira de naïve de parallelize o exemplo anterior. Este exemplo usa o algoritmo de concurrency::parallel_for_each para processar em paralelo a matriz e um objeto de concurrency::critical_section para sincronizar o acesso à variável de prime_sum . Este exemplo não dimensiona porque cada thread deve aguardar o recurso compartilhado para se torne disponível.
critical_section cs;
prime_sum = 0;
parallel_for_each(begin(a), end(a), [&](int i) {
cs.lock();
prime_sum += (is_prime(i) ? i : 0);
cs.unlock();
});
O exemplo a seguir usa um objeto de combinable para melhorar o desempenho do exemplo anterior. Este exemplo elimina a necessidade de objetos de sincronização; dimensões como o objeto de combinable permite que cada thread independente para executar a tarefa.
Um objeto de combinable é geralmente usado em duas etapas. Primeiro, gerar uma série de computações refinados executando o trabalho em paralelo. Em seguida, combina (ou) reduza as computações em um resultado final. Este exemplo usa o método de concurrency::combinable::local para obter uma referência à soma local. Usa o método de concurrency::combinable::combine e um objeto de std::plus para combinar as computações locais no resultado final.
combinable<int> sum;
parallel_for_each(begin(a), end(a), [&](int i) {
sum.local() += (is_prime(i) ? i : 0);
});
prime_sum = sum.combine(plus<int>());
O exemplo completo calcula a soma de números à esquerda em série ou em paralelo. O exemplo grava no console o tempo necessário para executar computações ambas.
// parallel-sum-of-primes.cpp
// compile with: /EHsc
#include <windows.h>
#include <ppl.h>
#include <array>
#include <numeric>
#include <iostream>
using namespace concurrency;
using namespace std;
// Calls the provided work function and returns the number of milliseconds
// that it takes to call that function.
template <class Function>
__int64 time_call(Function&& f)
{
__int64 begin = GetTickCount();
f();
return GetTickCount() - begin;
}
// Determines whether the input value is prime.
bool is_prime(int n)
{
if (n < 2)
return false;
for (int i = 2; i < n; ++i)
{
if ((n % i) == 0)
return false;
}
return true;
}
int wmain()
{
// Create an array object that contains 200000 integers.
array<int, 200000> a;
// Initialize the array such that a[i] == i.
iota(begin(a), end(a), 0);
int prime_sum;
__int64 elapsed;
// Compute the sum of the numbers in the array that are prime.
elapsed = time_call([&] {
prime_sum = accumulate(begin(a), end(a), 0, [&](int acc, int i) {
return acc + (is_prime(i) ? i : 0);
});
});
wcout << prime_sum << endl;
wcout << L"serial time: " << elapsed << L" ms" << endl << endl;
// Now perform the same task in parallel.
elapsed = time_call([&] {
combinable<int> sum;
parallel_for_each(begin(a), end(a), [&](int i) {
sum.local() += (is_prime(i) ? i : 0);
});
prime_sum = sum.combine(plus<int>());
});
wcout << prime_sum << endl;
wcout << L"parallel time: " << elapsed << L" ms" << endl << endl;
}
A seguinte saída de exemplo é para um computador que tem quatro processadores.
Compilando o código
Para compilar o código, copie-a e cole-o em um projeto do Visual Studio, ou cole-o em um arquivo chamadoparallel-sum-of-primes.cpp e execute o comando a seguir em uma janela de prompt de comando do Visual Studio.
cl.exe /EHsc parallel-sum-of-primes.cpp
Programação robusta
Para obter um exemplo que usa o mapa e reduzir as operações para produzir os mesmos resultados, consulte Algoritmos paralelos.