HOW TO:使用可組合的類別改善效能
本範例顯示如何使用 concurrency::combinable 類別,來計算中的數字的總和 std::array 是主要的物件。combinable 類別會透過排除共用狀態,改善效能。
![]() |
---|
在某些情況下,平行對應 (concurrency::parallel_transform),並降低 (並行:: parallel_reduce) 可提供效能改進,透過combinable。如需範例,使用對應,並減少作業,以產生相同的結果,如這個範例,請參閱的平行演算法。 |
範例
下列範例會使用 std::accumulate 函式來計算陣列中屬於質數的元素總和。在這個範例中,a 是 array 物件,而且 is_prime 函式會判斷其輸入值是否為質數。
prime_sum = accumulate(begin(a), end(a), 0, [&](int acc, int i) {
return acc + (is_prime(i) ? i : 0);
});
下列範例顯示平行處理上一則範例的自然方式。這個範例會使用 concurrency::parallel_for_each 演算法來處理陣列以平行方式與 concurrency::critical_section 物件來同步存取prime_sum變數。這個範例不會調整,因為每個執行緒都必須等候共用資源成為可用。
critical_section cs;
prime_sum = 0;
parallel_for_each(begin(a), end(a), [&](int i) {
cs.lock();
prime_sum += (is_prime(i) ? i : 0);
cs.unlock();
});
下列範例會使用 combinable 物件來改善上一則範例的效能。這個範例會排除同步處理物件的需求。它會進行調整,因為 combinable 物件可讓每個執行緒獨立執行其工作。
combinable 物件通常會用於兩個步驟中。首先,以平行方式執行工作,藉以產生一連串精細的運算。接著,將運算結合 (或減少) 成最終結果。這個範例會使用 concurrency::combinable::local 方法,以取得本機的加總的參考。然後會使用 concurrency::combinable::combine 方法及 a std::plus 來組合成最終結果的本機計算的物件。
combinable<int> sum;
parallel_for_each(begin(a), end(a), [&](int i) {
sum.local() += (is_prime(i) ? i : 0);
});
prime_sum = sum.combine(plus<int>());
下列範例會同時以循序和平行方式計算質數的總和。此範例會將執行這兩個運算所需的時間列印至主控台。
// parallel-sum-of-primes.cpp
// compile with: /EHsc
#include <windows.h>
#include <ppl.h>
#include <array>
#include <numeric>
#include <iostream>
using namespace concurrency;
using namespace std;
// Calls the provided work function and returns the number of milliseconds
// that it takes to call that function.
template <class Function>
__int64 time_call(Function&& f)
{
__int64 begin = GetTickCount();
f();
return GetTickCount() - begin;
}
// Determines whether the input value is prime.
bool is_prime(int n)
{
if (n < 2)
return false;
for (int i = 2; i < n; ++i)
{
if ((n % i) == 0)
return false;
}
return true;
}
int wmain()
{
// Create an array object that contains 200000 integers.
array<int, 200000> a;
// Initialize the array such that a[i] == i.
iota(begin(a), end(a), 0);
int prime_sum;
__int64 elapsed;
// Compute the sum of the numbers in the array that are prime.
elapsed = time_call([&] {
prime_sum = accumulate(begin(a), end(a), 0, [&](int acc, int i) {
return acc + (is_prime(i) ? i : 0);
});
});
wcout << prime_sum << endl;
wcout << L"serial time: " << elapsed << L" ms" << endl << endl;
// Now perform the same task in parallel.
elapsed = time_call([&] {
combinable<int> sum;
parallel_for_each(begin(a), end(a), [&](int i) {
sum.local() += (is_prime(i) ? i : 0);
});
prime_sum = sum.combine(plus<int>());
});
wcout << prime_sum << endl;
wcout << L"parallel time: " << elapsed << L" ms" << endl << endl;
}
下列是針對配備四個處理器之電腦的範例輸出。
1709600813
serial time: 6178 ms
1709600813
parallel time: 1638 ms
編譯程式碼
若要編譯的程式碼,將它複製然後將它貼在 Visual Studio 專案中,或將它貼在檔名為平行-sum 位的-primes.cpp ,然後執行下列命令,Visual Studio 的命令提示字元] 視窗中。
cl.exe /EHsc parallel-sum-of-primes.cpp
穩固程式設計
如需範例,使用對應,並減少作業,以產生相同的結果,請參閱的平行演算法。