Библиотека параллельных шаблонов
Библиотека параллельных шаблонов (PPL) предоставляет императивную модель программирования, обеспечивающую масштабируемость и повышающую удобство разработки параллельных приложений. Библиотека PPL основана на компонентах планирования и управления ресурсами среды выполнения с параллелизмом. Она создает уровень абстракции между кодом приложения и базовым потоковым механизмом, предоставляя универсальные типобезопасные алгоритмы и контейнеры, работающие с данными параллельно. Кроме того, PPL позволяет разрабатывать приложения с возможностью масштабирования, предоставляя альтернативы состоянию с общим доступом.
PPL обеспечивает следующие возможности.
Параллелизм задач: механизм, который работает над Windows ThreadPool для параллельного выполнения нескольких рабочих элементов (задач)
Параллельные алгоритмы: универсальные алгоритмы, которые работают поверх среды выполнения параллелизма для параллельного использования коллекций данных
Параллельные контейнеры и объекты: универсальные типы контейнеров, обеспечивающие безопасный одновременный доступ к их элементам
Пример
PPL предоставляет модель программирования, похожую на стандартную библиотеку C++. В следующем примере показаны различные функции PPL. В нем последовательно и параллельно вычисляется несколько чисел Фибоначчи. Оба вычисления действуют на объекте std::array . В этом примере в консоль также выводится время, необходимое на выполнение обоих вычислений.
Последовательная версия использует алгоритм стандартной библиотеки C++ std:::for_each для обхода массива и хранения результатов в объекте std::vector . Параллельная версия выполняет ту же задачу, но использует алгоритм параллелизма PPL ::p arallel_for_each и сохраняет результаты в объекте параллелизма::concurrent_vector . Класс concurrent_vector
позволяет каждой итерации цикла одновременно добавлять элементы, не требуя синхронизации доступа на запись в контейнер.
Поскольку parallel_for_each
действует одновременно, версия программы для параллельного вычисления, используемая в данном примере, должна выполнить сортировку объекта concurrent_vector
, чтобы получить те же результаты, что и версия программы для последовательного вычисления.
Обратите внимание, что в примере используется упрощенный метод вычисления чисел Фибоначчи, однако этот метод показывает, как с помощью среды выполнения с параллелизмом можно повысить производительность системы при выполнении длинных вычислений.
// parallel-fibonacci.cpp
// compile with: /EHsc
#include <windows.h>
#include <ppl.h>
#include <concurrent_vector.h>
#include <array>
#include <vector>
#include <tuple>
#include <algorithm>
#include <iostream>
using namespace concurrency;
using namespace std;
// Calls the provided work function and returns the number of milliseconds
// that it takes to call that function.
template <class Function>
__int64 time_call(Function&& f)
{
__int64 begin = GetTickCount();
f();
return GetTickCount() - begin;
}
// Computes the nth Fibonacci number.
int fibonacci(int n)
{
if(n < 2)
return n;
return fibonacci(n-1) + fibonacci(n-2);
}
int wmain()
{
__int64 elapsed;
// An array of Fibonacci numbers to compute.
array<int, 4> a = { 24, 26, 41, 42 };
// The results of the serial computation.
vector<tuple<int,int>> results1;
// The results of the parallel computation.
concurrent_vector<tuple<int,int>> results2;
// Use the for_each algorithm to compute the results serially.
elapsed = time_call([&]
{
for_each (begin(a), end(a), [&](int n) {
results1.push_back(make_tuple(n, fibonacci(n)));
});
});
wcout << L"serial time: " << elapsed << L" ms" << endl;
// Use the parallel_for_each algorithm to perform the same task.
elapsed = time_call([&]
{
parallel_for_each (begin(a), end(a), [&](int n) {
results2.push_back(make_tuple(n, fibonacci(n)));
});
// Because parallel_for_each acts concurrently, the results do not
// have a pre-determined order. Sort the concurrent_vector object
// so that the results match the serial version.
sort(begin(results2), end(results2));
});
wcout << L"parallel time: " << elapsed << L" ms" << endl << endl;
// Print the results.
for_each (begin(results2), end(results2), [](tuple<int,int>& pair) {
wcout << L"fib(" << get<0>(pair) << L"): " << get<1>(pair) << endl;
});
}
В следующем примере показаны выходные данные, полученные на четырехпроцессорном компьютере.
serial time: 9250 ms
parallel time: 5726 ms
fib(24): 46368
fib(26): 121393
fib(41): 165580141
fib(42): 267914296
Все итерации цикла различаются по продолжительности. Производительность parallel_for_each
ограничивается операцией, которая завершается последней. Следовательно, не стоит ожидать линейного повышения производительности системы в зависимости от версий, используемых в данном примере (для последовательных и параллельных вычислений).
См. также
Заголовок | Description |
---|---|
Параллелизм задач | Описывает роль задач и групп задач в PPL. |
Параллельные алгоритмы | Описывает способы использования алгоритмов параллельной обработки, таких как parallel_for и parallel_for_each . |
Параллельные контейнеры и объекты | Описывает различные параллельные контейнеры и объекты, предоставляемые PPL. |
Отмена в библиотеке параллельных шаблонов | Объясняет, как отменить работу, выполняемую алгоритмом параллельной обработки. |
Среда выполнения с параллелизмом | Описывает среду выполнения с параллелизмом, которая упрощает процесс параллельного программирования и содержит ссылки на соответствующие разделы. |