Desempenho de qsort vs std :: sort?

Segundo Scott Meyers, em seu livro Effective STL - item 46. Ele afirmou questd::sort é cerca de 670% mais rápido questd::qsort devido ao fato de inline. Eu me testei e vi que o qsort é mais rápido :(! Alguém poderia me ajudar a explicar esse comportamento estranho?

#include <iostream>
#include <vector>
#include <algorithm>

#include <cstdlib>
#include <ctime>
#include <cstdio>

const size_t LARGE_SIZE = 100000;

struct rnd {
    int operator()() {
        return rand() % LARGE_SIZE;
    }
};

int comp( const void* a, const void* b ) {
    return ( *( int* )a - *( int* )b );
}

int main() {
    int ary[LARGE_SIZE];
    int ary_copy[LARGE_SIZE];
    // generate random data
    std::generate( ary, ary + LARGE_SIZE, rnd() );
    std::copy( ary, ary + LARGE_SIZE, ary_copy );
    // get time
    std::time_t start = std::clock();
    // perform quick sort C using function pointer
    std::qsort( ary, LARGE_SIZE, sizeof( int ), comp );
    std::cout << "C quick-sort time elapsed: " << static_cast<double>( clock() - start ) / CLOCKS_PER_SEC << "\n";
    // get time again
    start = std::clock();
    // perform quick sort C++ using function object
    std::sort( ary_copy, ary_copy + LARGE_SIZE );
    std::cout << "C++ quick-sort time elapsed: " << static_cast<double>( clock() - start ) / CLOCKS_PER_SEC << "\n";
}

Este é o meu resultado:

C quick-sort time elapsed: 0.061
C++ quick-sort time elapsed: 0.086
Press any key to continue . . .

Atualizar

STL Eficaz 3ª Edição (2001)
Capítulo 7 Programando com STL
Item 46: Considere objetos de função em vez de funções como parâmetros de algoritmo.

Cumprimentos,

questionAnswers(7)

yourAnswerToTheQuestion