Практическое руководство. Запись parallel_for_each
цикла
В этом примере показано, как использовать concurrency::parallel_for_each
алгоритм для вычисления количества простых чисел в std::array
объекте параллельно.
Пример
В следующем примере вычисляется количество простых чисел в массиве два раза. В примере сначала используется std::for_each
алгоритм для последовательного вычисления количества. Затем в примере используется parallel_for_each
алгоритм для параллельного выполнения одной и той же задачи. В этом примере в консоль также выводится время, необходимое на выполнение обоих вычислений.
// parallel-count-primes.cpp
// compile with: /EHsc
#include <windows.h>
#include <ppl.h>
#include <iostream>
#include <algorithm>
#include <array>
using namespace concurrency;
using namespace std;
// Returns the number of milliseconds that it takes to call the passed in function.
template <class Function>
__int64 time_call(Function&& f)
{
__int64 begin = GetTickCount();
f();
return GetTickCount() - begin;
}
// Determines whether the input is a prime.
bool is_prime(int n)
{
if (n < 2)
{
return false;
}
for (int i = 2; i < int(std::sqrt(n)) + 1; ++i)
{
if (n % i == 0)
{
return false;
}
}
return true;
}
int wmain()
{
// Create an array object that contains 200000 integers.
array<int, 200000> a;
// Initialize the array such that a[i] == i.
int n = 0;
generate(begin(a), end(a), [&]
{
return n++;
});
// Use the for_each algorithm to count, serially, the number
// of prime numbers in the array.
LONG prime_count = 0L;
__int64 elapsed = time_call([&]
{
for_each(begin(a), end(a), [&](int n)
{
if (is_prime(n))
{
++prime_count;
}
});
});
wcout << L"serial version: " << endl
<< L"found " << prime_count << L" prime numbers" << endl
<< L"took " << elapsed << L" ms" << endl << endl;
// Use the parallel_for_each algorithm to count, in parallel, the number
// of prime numbers in the array.
prime_count = 0L;
elapsed = time_call([&]
{
parallel_for_each(begin(a), end(a), [&](int n)
{
if (is_prime(n))
{
InterlockedIncrement(&prime_count);
}
});
});
wcout << L"parallel version: " << endl
<< L"found " << prime_count << L" prime numbers" << endl
<< L"took " << elapsed << L" ms" << endl << endl;
}
В следующем примере выходных данных используется компьютер с четырьмя ядрами.
serial version:
found 17984 prime numbers
took 125 ms
parallel version:
found 17984 prime numbers
took 63 ms
Компиляция кода
Чтобы скомпилировать код, скопируйте его и вставьте его в проект Visual Studio или вставьте его в файл с именем parallel-count-primes.cpp
, а затем выполните следующую команду в окне командной строки Visual Studio.
cl.exe /EHsc parallel-count-primes.cpp
Отказоустойчивость
Лямбда-выражение, которое в примере передается parallel_for_each
алгоритму, использует InterlockedIncrement
функцию, чтобы включить параллельные итерации цикла для одновременного увеличения счетчика. Если вы используете такие функции, как InterlockedIncrement
синхронизация доступа к общим ресурсам, в коде могут возникнуть узкие места производительности. Можно использовать механизм синхронизации без блокировки, например concurrency::combinable
класс, чтобы устранить одновременный доступ к общим ресурсам. Пример, использующий combinable
класс таким образом, см. в разделе "Практическое руководство. Использование объединения для повышения производительности".