Porady: korzystanie z wyników połączonych do poprawiania wydajności
W tym przykładzie przedstawiono sposób użycia concurrency::combinable klasy, aby obliczyć sumę liczb w std::array obiektu, które są Premier.combinable Klasy polepsza wydajność dzięki wyeliminowaniu stan udostępnionego.
Porada |
---|
W niektórych przypadkach równoległe mapy (concurrency::parallel_transform) i zmniejszenia (współbieżności:: parallel_reduce) daje poprawę wydajności ponad combinable.Na przykład że używa mapowania i zmniejszyć operacji, aby generowała te same wyniki, co w tym przykładzie, zobacz Algorytmy równoległe. |
Przykład
W poniższym przykładzie użyto std::accumulate funkcji, aby obliczyć sumę elementów w tablicy, które są Premier.W tym przykładzie a jest array obiektu i is_prime funkcja określa, czy jej wartość wejściowa jest Premier.
prime_sum = accumulate(begin(a), end(a), 0, [&](int acc, int i) {
return acc + (is_prime(i) ? i : 0);
});
Poniższy przykład pokazuje sposób naiwny zrównoleglają w poprzednim przykładzie.W poniższym przykładzie użyto concurrency::parallel_for_each algorytm przetworzyć tablicy równolegle i concurrency::critical_section obiekt, aby zsynchronizować dostęp do prime_sum zmiennej.W tym przykładzie nie jest skalowany, ponieważ każdy wątek musi czekać na udostępnionego zasobu stają się dostępne.
critical_section cs;
prime_sum = 0;
parallel_for_each(begin(a), end(a), [&](int i) {
cs.lock();
prime_sum += (is_prime(i) ? i : 0);
cs.unlock();
});
W poniższym przykładzie użyto combinable obiekt, aby poprawić wydajność z poprzedniego przykładu.W tym przykładzie eliminuje potrzebę synchronizacji obiektów; plastrowe, ponieważ combinable obiektu umożliwia każdego wątku w celu wykonania swojego zadania niezależnie od siebie.
A combinable obiekt jest zazwyczaj używany w dwóch etapach.Po pierwsze produktu szereg obliczeń szczegółowymi zasadami wykonywania pracy równolegle.Następnie połączyć (lub zmniejszenia) obliczeń w wyniku końcowego.W poniższym przykładzie użyto concurrency::combinable::local metoda uzyskania odwołania do lokalnego suma.Następnie używa concurrency::combinable::combine metody i std::plus obiekt, aby połączyć lokalne obliczeń w wyniku końcowego.
combinable<int> sum;
parallel_for_each(begin(a), end(a), [&](int i) {
sum.local() += (is_prime(i) ? i : 0);
});
prime_sum = sum.combine(plus<int>());
Poniższy przykład pełną oblicza sumę liczb pierwszych zarówno szeregowo i równolegle.W przykładzie drukuje do konsoli czas, który jest wymagane do przeprowadzenia zarówno obliczeń.
// parallel-sum-of-primes.cpp
// compile with: /EHsc
#include <windows.h>
#include <ppl.h>
#include <array>
#include <numeric>
#include <iostream>
using namespace concurrency;
using namespace std;
// Calls the provided work function and returns the number of milliseconds
// that it takes to call that function.
template <class Function>
__int64 time_call(Function&& f)
{
__int64 begin = GetTickCount();
f();
return GetTickCount() - begin;
}
// Determines whether the input value is prime.
bool is_prime(int n)
{
if (n < 2)
return false;
for (int i = 2; i < n; ++i)
{
if ((n % i) == 0)
return false;
}
return true;
}
int wmain()
{
// Create an array object that contains 200000 integers.
array<int, 200000> a;
// Initialize the array such that a[i] == i.
iota(begin(a), end(a), 0);
int prime_sum;
__int64 elapsed;
// Compute the sum of the numbers in the array that are prime.
elapsed = time_call([&] {
prime_sum = accumulate(begin(a), end(a), 0, [&](int acc, int i) {
return acc + (is_prime(i) ? i : 0);
});
});
wcout << prime_sum << endl;
wcout << L"serial time: " << elapsed << L" ms" << endl << endl;
// Now perform the same task in parallel.
elapsed = time_call([&] {
combinable<int> sum;
parallel_for_each(begin(a), end(a), [&](int i) {
sum.local() += (is_prime(i) ? i : 0);
});
prime_sum = sum.combine(plus<int>());
});
wcout << prime_sum << endl;
wcout << L"parallel time: " << elapsed << L" ms" << endl << endl;
}
Następujące przykładowe dane wyjściowe pochodzą z komputera, który ma cztery procesory.
Kompilowanie kodu
Aby skompilować kod, skopiuj go a następnie wkleić go w projekcie programu Visual Studio lub wkleić go w pliku o nazwie równolegle Suma z primes.cpp , a następnie uruchomić następujące polecenie w oknie wiersza polecenia programu Visual Studio.
cl.exe /EHsc parallel-sum-of-primes.cpp
Stabilne programowanie
Na przykład że używa mapowania i zmniejszyć operacji, aby generowała te same wyniki, zobacz Algorytmy równoległe.