Практическое руководство. Использование класса combinable для повышения производительности
В этом примере показано, как использовать класс concurrency::combinable, чтобы вычислять сумму простых чисел в объекте std::array. Класс combinable повышает производительность за счет исключения совместно используемого состояния.
Совет
В некоторых случаях параллельное сопоставление (concurrency::parallel_transform) и снижение (concurrency:: parallel_reduce) может предоставлять увеличение производительности по сравнению с combinable.Пример, использующий операции сопоставления и снижения для получения тех же результатов, что и в этом примере, см. в разделе Параллельные алгоритмы.
Пример
В следующем примере функция std::accumulate используется для вычисления суммы элементов массива, которые являются простыми числами. В этом примере a является объектом array, а функция is_prime определяет, является ли входное значение простым числом.
prime_sum = accumulate(begin(a), end(a), 0, [&](int acc, int i) {
return acc + (is_prime(i) ? i : 0);
});
В следующем примере демонстрируется наивный способ параллельного выполнения предыдущего примера. В этом примере алгоритм concurrency::parallel_for_each используется для параллельной обработки массива, а объект concurrency::critical_section используется для синхронизации доступа к переменной prime_sum. Этот пример не является масштабируемым, так как каждый поток должен ожидать, пока станет доступным совместно используемый ресурс.
critical_section cs;
prime_sum = 0;
parallel_for_each(begin(a), end(a), [&](int i) {
cs.lock();
prime_sum += (is_prime(i) ? i : 0);
cs.unlock();
});
В следующем примере объект combinable используется повышения производительности предыдущего примера. В этом примере исключается необходимость в объектах синхронизации; он является масштабируемым, так как объект combinable позволяет каждому потоку выполнять свою задачу независимо.
Объект combinable обычно используется в два этапа. Сначала для создания последовательности мелких фрагментов вычислений для параллельной обработки. Затем для объединения (или сокращения) вычислений в конечный результат. В этом примере для получения ссылки на локальную сумму используется метод concurrency::combinable::local. Затем используются метод concurrency::combinable::combine и объект std::plus, чтобы объединить вычисления в конечный результат.
combinable<int> sum;
parallel_for_each(begin(a), end(a), [&](int i) {
sum.local() += (is_prime(i) ? i : 0);
});
prime_sum = sum.combine(plus<int>());
В следующем полном примере сумма простых чисел вычисляется как последовательно, так и параллельно. В этом примере на консоль выводится продолжительность выполнения этих двух вычислений.
// parallel-sum-of-primes.cpp
// compile with: /EHsc
#include <windows.h>
#include <ppl.h>
#include <array>
#include <numeric>
#include <iostream>
using namespace concurrency;
using namespace std;
// Calls the provided work function and returns the number of milliseconds
// that it takes to call that function.
template <class Function>
__int64 time_call(Function&& f)
{
__int64 begin = GetTickCount();
f();
return GetTickCount() - begin;
}
// Determines whether the input value is prime.
bool is_prime(int n)
{
if (n < 2)
return false;
for (int i = 2; i < n; ++i)
{
if ((n % i) == 0)
return false;
}
return true;
}
int wmain()
{
// Create an array object that contains 200000 integers.
array<int, 200000> a;
// Initialize the array such that a[i] == i.
iota(begin(a), end(a), 0);
int prime_sum;
__int64 elapsed;
// Compute the sum of the numbers in the array that are prime.
elapsed = time_call([&] {
prime_sum = accumulate(begin(a), end(a), 0, [&](int acc, int i) {
return acc + (is_prime(i) ? i : 0);
});
});
wcout << prime_sum << endl;
wcout << L"serial time: " << elapsed << L" ms" << endl << endl;
// Now perform the same task in parallel.
elapsed = time_call([&] {
combinable<int> sum;
parallel_for_each(begin(a), end(a), [&](int i) {
sum.local() += (is_prime(i) ? i : 0);
});
prime_sum = sum.combine(plus<int>());
});
wcout << prime_sum << endl;
wcout << L"parallel time: " << elapsed << L" ms" << endl << endl;
}
В следующем примере показаны выходные данные, полученные на четырехпроцессорном компьютере.
Компиляция кода
Чтобы скомпилировать код, скопируйте и вставьте его в проект Visual Studio или в файл с именем parallel-sum-of-primes.cpp, затем выполните в окне командной строки Visual Studio следующую команду.
cl.exe /EHsc parallel-sum-of-primes.cpp
Отказоустойчивость
Пример, использующий операции сопоставление и снижения, чтобы получить те же результаты, см. в разделе Параллельные алгоритмы.