Библиотека параллельных шаблонов

Статья
06/09/2015

Библиотека параллельных шаблонов (PPL) предоставляет императивную модель программирования, обеспечивающую масштабируемость и повышающую удобство разработки параллельных приложений. Библиотека PPL основана на компонентах планирования и управления ресурсами среды выполнения с параллелизмом. Она создает уровень абстракции между кодом приложения и базовым потоковым механизмом, предоставляя универсальные типобезопасные алгоритмы и контейнеры, работающие с данными параллельно. Кроме того, PPL позволяет разрабатывать приложения с возможностью масштабирования, предоставляя альтернативы состоянию с общим доступом.

Класс task и связанные типы, определенные в файле ppltasks.h, могут переноситься между платформами. Параллельные алгоритмы и контейнеры переноситься не могут.

PPL обеспечивает следующие возможности.

Параллелизм задач — механизм параллельного выполнения нескольких рабочих элементов (задач).
Параллельные алгоритмы — универсальные алгоритмы, которые параллельно работают с несколькими коллекциями данных.
Параллельные контейнеры и объекты — универсальные типы контейнеров, предоставляющие безопасный одновременный доступ к содержащимся в них элементам.

Пример

PPL предоставляет модель программирования, схожую с библиотекой стандартных шаблонов (STL). В следующем примере показаны различные функции PPL. В нем последовательно и параллельно вычисляется несколько чисел Фибоначчи. Оба вычисления работают с объектом std::array. В этом примере в консоль также выводится время, необходимое на выполнение обоих вычислений.

Версия программы для последовательного вычисления использует для прохождения массива алгоритм std::for_each STL и сохраняет результаты в объекте std::vector. Версия программы для параллельного вычисления выполняет ту же задачу, но использует алгоритм concurrency::parallel_for_each PLL и сохраняет результаты в объекте concurrency::concurrent_vector. Класс concurrent_vector позволяет каждой итерации цикла одновременно добавлять элементы, не требуя синхронизации доступа на запись в контейнер.

Поскольку parallel_for_each действует одновременно, версия программы для параллельного вычисления, используемая в данном примере, должна выполнить сортировку объекта concurrent_vector, чтобы получить те же результаты, что и версия программы для последовательного вычисления.

Обратите внимание, что в примере используется упрощенный метод вычисления чисел Фибоначчи, однако этот метод показывает, как с помощью среды выполнения с параллелизмом можно повысить производительность системы при выполнении длинных вычислений.

// parallel-fibonacci.cpp 
// compile with: /EHsc
#include <windows.h>
#include <ppl.h>
#include <concurrent_vector.h>
#include <array>
#include <vector>
#include <tuple>
#include <algorithm>
#include <iostream>

using namespace concurrency;
using namespace std;

// Calls the provided work function and returns the number of milliseconds  
// that it takes to call that function. 
template <class Function>
__int64 time_call(Function&& f)
{
   __int64 begin = GetTickCount();
   f();
   return GetTickCount() - begin;
}

// Computes the nth Fibonacci number. 
int fibonacci(int n)
{
   if(n < 2)
      return n;
   return fibonacci(n-1) + fibonacci(n-2);
}

int wmain()
{
   __int64 elapsed;

   // An array of Fibonacci numbers to compute. 
   array<int, 4> a = { 24, 26, 41, 42 };

   // The results of the serial computation.
   vector<tuple<int,int>> results1;

   // The results of the parallel computation.
   concurrent_vector<tuple<int,int>> results2;

   // Use the for_each algorithm to compute the results serially.
   elapsed = time_call([&] 
   {
      for_each (begin(a), end(a), [&](int n) {
         results1.push_back(make_tuple(n, fibonacci(n)));
      });
   });   
   wcout << L"serial time: " << elapsed << L" ms" << endl;

   // Use the parallel_for_each algorithm to perform the same task.
   elapsed = time_call([&] 
   {
      parallel_for_each (begin(a), end(a), [&](int n) {
         results2.push_back(make_tuple(n, fibonacci(n)));
      });

      // Because parallel_for_each acts concurrently, the results do not  
      // have a pre-determined order. Sort the concurrent_vector object 
      // so that the results match the serial version.
      sort(begin(results2), end(results2));
   });   
   wcout << L"parallel time: " << elapsed << L" ms" << endl << endl;

   // Print the results.
   for_each (begin(results2), end(results2), [](tuple<int,int>& pair) {
      wcout << L"fib(" << get<0>(pair) << L"): " << get<1>(pair) << endl;
   });
}

В следующем примере показаны выходные данные, полученные на четырехпроцессорном компьютере.

Все итерации цикла различаются по продолжительности. Производительность parallel_for_each ограничивается операцией, которая завершается последней. Следовательно, не стоит ожидать линейного повышения производительности системы в зависимости от версий, используемых в данном примере (для последовательных и параллельных вычислений).

См. также

Заголовок	Описание
Параллелизм задач (среда выполнения с параллелизмом)	Описывает роль задач и групп задач в PPL.
Параллельные алгоритмы	Описывает способы использования алгоритмов параллельной обработки, таких как parallel_for и parallel_for_each.
Параллельные контейнеры и объекты	Описывает различные параллельные контейнеры и объекты, предоставляемые PPL.
Отмена в библиотеке параллельных шаблонов	Объясняет, как отменить работу, выполняемую алгоритмом параллельной обработки.
Среда выполнения с параллелизмом	Описывает среду выполнения с параллелизмом, которая упрощает процесс параллельного программирования и содержит ссылки на соответствующие разделы.

Поделиться через

Библиотека параллельных шаблонов

Пример

См. также

Дополнительные ресурсы