Cada iteração de um loop for / for_each pode ser feita em paralelo? (C ++ 11)

Estou iterando sobre um vetor de estruturas e processando cada struct individualmente.
Parece algo como isto:

for_each(begin(data),end(data),DoTask);
//assume "data" is std::vector<DataT>  
//assume DoTask is a function that takes a DataT by reference

O código é significativamente lento porque DoTask se conecta a sites específicos e analisa HTML.
Qual seria a melhor maneira de acelerar isso?
Meu objetivo é analisar vários DataTs ao mesmo tempo.
Eu sou muito novo em segmentação, masstd :: async&nbsp;estd :: future&nbsp;parece promissor.