Procedura: scrivere un ciclo parallel_for_each
In questo esempio viene illustrato come utilizzare l'algoritmo Concurrency::parallel_for_each per calcolare il conteggio dei numeri primi in un oggetto std::array in parallelo.
Esempio
Nell'esempio seguente viene calcolato due volte il conteggio dei numeri primi in una matrice. Nell'esempio viene innanzitutto utilizzato l'algoritmo std::for_each per calcolare il conteggio in serie. Viene quindi utilizzato l'algoritmo parallel_for_each per eseguire la stessa attività in parallelo. L'esempio inoltre visualizza nella console il tempo necessario per eseguire entrambi i calcoli.
// parallel-count-primes.cpp
// compile with: /EHsc
#include <windows.h>
#include <ppl.h>
#include <iostream>
#include <algorithm>
#include <array>
using namespace Concurrency;
using namespace std;
// Calls the provided work function and returns the number of milliseconds
// that it takes to call that function.
template <class Function>
__int64 time_call(Function&& f)
{
__int64 begin = GetTickCount();
f();
return GetTickCount() - begin;
}
// Determines whether the input value is prime.
bool is_prime(int n)
{
if (n < 2)
return false;
for (int i = 2; i < n; ++i)
{
if ((n % i) == 0)
return false;
}
return true;
}
int wmain()
{
// Create an array object that contains 200000 integers.
array<int, 200000> a;
// Initialize the array such that a[i] == i.
int n = 0;
generate(a.begin(), a.end(), [&] {
return n++;
});
LONG prime_count;
__int64 elapsed;
// Use the for_each algorithm to count the number of prime numbers
// in the array serially.
prime_count = 0L;
elapsed = time_call([&] {
for_each (a.begin(), a.end(), [&](int n ) {
if (is_prime(n))
++prime_count;
});
});
wcout << L"serial version: " << endl
<< L"found " << prime_count << L" prime numbers" << endl
<< L"took " << elapsed << L" ms" << endl << endl;
// Use the parallel_for_each algorithm to count the number of prime numbers
// in the array in parallel.
prime_count = 0L;
elapsed = time_call([&] {
parallel_for_each (a.begin(), a.end(), [&](int n ) {
if (is_prime(n))
InterlockedIncrement(&prime_count);
});
});
wcout << L"parallel version: " << endl
<< L"found " << prime_count << L" prime numbers" << endl
<< L"took " << elapsed << L" ms" << endl << endl;
}
L'output di esempio seguente è relativo a un computer con quattro processori.
serial version:
found 17984 prime numbers
took 6115 ms
parallel version:
found 17984 prime numbers
took 1653 ms
Compilazione del codice
Per compilare il codice, copiarlo e quindi incollarlo in un progetto di Visual Studio o incollarlo in un file denominato parallel-count-primes.cpp, quindi eseguire il comando seguente in una finestra del prompt dei comandi di Visual Studio.
cl.exe /EHsc parallel-count-primes.cpp
Programmazione efficiente
L'espressione lambda che nell'esempio viene passata all'algoritmo parallel_for_each utilizza la funzione InterlockedIncrement per consentire alle iterazioni parallele del ciclo di incrementare simultaneamente il contatore. Se si utilizzano funzioni come InterlockedIncrement per sincronizzare l'accesso alle risorse condivise, è possibile che nel codice si verifichino colli di bottiglia a livello di prestazioni. È possibile utilizzare un meccanismo di sincronizzazione senza blocco, ad esempio la classe Concurrency::combinable, per eliminare l'accesso simultaneo alle risorse condivise. Per un esempio in cui viene utilizzata la classe combinable nel modo suddetto, vedere Procedura: utilizzare la classe combinable per migliorare le prestazioni.