Да, я упростил его, просто выделив фиксированный буфер из 1024 событий со временем и тегом сообщения char [] фиксированной длины. Тогда вызов по метке времени очень дешев.

ужно проанализировать производительность некоторого кода в реальном времени на Windows.

Я не могу использовать ни один из обычных профилировщиков (Vtune, Codeanalyst), потому что я не могу замедлить исполняемый файл. Поэтому я использую свой собственный класс синхронизации, основанный на QueryPerformanceCounter ().

Существуют ли какие-либо существующие (бесплатные) библиотеки C ++ для регистрации результатов - НО мне нужно, чтобы они были буферизованы до конца цикла, я не могу позволить себе время записи в файл или журнал событий во время сбора данных.

Достаточно легко свернуть мой собственный, но если есть способ сделать log4cplus / qDebug или подобный журнал в буфер и выгрузить его позже, это сэкономит некоторые усилия.

 EmeryBerger18 янв. 2011 г., 18:40
Кроме того, VTune в Windows может выполнять выборку на основе событий, что не замедлит ваш кодвообще.
 EmeryBerger18 янв. 2011 г., 18:39
Обратите внимание, что процесс записи по-прежнему будет замедлять работу вашего исполняемого файла, перегружая кеш и занимая пропускную способность памяти. Кроме того, IIRC, QueryPerformanceCounter () существенно медленнее, чем прямой вызовRDTSC.
 Martin Beckett18 янв. 2011 г., 19:13
Vtune не может сказать вам время между получением сетевого события и завершением обработки результата. Xperf и т. Д. Говорят мне, что машина тратит много времени на функции ядра, но не потому, что FPS низкий. AMD не может проводить мероприятия на базе процессора Intel, а VTUNE дорогой
 Martin Beckett18 янв. 2011 г., 19:15
@EmeryBerger - да, вы не можете использовать его для добавления целых чисел. Но на уровне мс узнать, блокирует ли какой-либо вызов, или если задача занимает больше времени, чем я думаю, это нормально.
 Peon the Great18 янв. 2011 г., 18:56
Или вы можете попробовать xperf и ETW. В вашем случае, поскольку у вас есть VTune, EmeryBerger уже имеет решение, прокомментированное выше.

Ответы на вопрос(1)

Решение Вопроса

который делает это, потому что я не мог найти ничего, что делало бы то, что я хотел, но было все еще легко включить в существующий код с помощью методов кодирования-вставки.

(отредактируйте) Обратите внимание, что, как упоминалось в комментариях, сам процесс синхронизации меняет природу того, что вы синхронизируете. Но тогда я уверен, что вы понимаете это слишком хорошо. Этот класс все еще был очень полезен для меня в поиске горячих точек и узких мест, в дополнение к тому, что я дал хотя бы приблизительную оценку того, сколько времени займет выполнение определенного кода. Код, который я представляю здесь, былникогда предназначен для производства достойным. Используйте это как таковое.

Вот пример вывода моего класса:

Timer Precision = 385 ns


=== Item               Trials    Ttl Time  Avg Time  Mean Time StdDev    ===
    DB Connect         1         0.11 s    0.11 s    0.11 s    0.0000 ps
    Entry Parse        3813      0.33 s    86 us     82 us     18 us
    File Load          1         50 ms     50 ms     50 ms     0.0000 ps
    Option Parse       1         5 ms      5 ms      5 ms      0.0000 ps
    Record Update      3812      0.53 s    140 us    127 us    49 us
============================================================================

Каждый «Элемент» - это одна часть кода, которую я хотел найти.Timer объект использует RAII (черезauto_ptr) для автоматического запуска и остановки. Вот пример клиентского кода, демонстрирующего, как его использовать:

Образец кода:
int main(int ac, char* av[])
{
    std::auto_ptr<dbg::Timer> section_timer(new dbg::Timer("Option Parse"));
    // MAGIC: Parse the command line...

    section_timer = auto_ptr<dbg::Timer>(new dbg::Timer("File Load"));
    // MAGIC: Load a big file...        

    section_timer = auto_ptr<dbg::Timer>(new dbg::Timer("DB Connect"));
    // MAGIC: Establish a DB connection...

    for( /* for each item in the file*/  )
    {
      section_timer = auto_ptr<dbg::Timer>(new dbg::Timer("Entry Parse"));
      // MAGIC: Parse the incoming item
      section_timer = auto_ptr<dbg::Timer>(new dbg::Timer("Record Update"));
      // MAGIC: Update the database
    }

    // Dump the output shown above    

    cout << dbg::Timer::DumpTrials() << endl;
}

Реализация этого класса находится во включаемой библиотеке. Вам не нужно ничего компилировать. Я использую Boost.Format для форматирования строк, но это можно заменить достаточно просто.

Вот реализация (моя фактическая реализация разделяет это на два файла,core.h а такжеcore_dbg.hpp; последний#includeедь прямо из бывшего).

Реализация:
namespace dbg
{
    class Timer
    {
    public:
        inline Timer(const std::string & name);
        inline Timer(const Timer& rhs);
        inline virtual ~Timer();
        inline std::string format_now() const;
        double current_elapsed() const;

        Timer& operator=(const std::string& name);

        static std::string DumpTrials(bool ClipboardAlso=false);            
        static void Reset();
        static std::string format_elapsed(double d) ;

    private:
        typedef std::string key_type;
        typedef double time_type;
        typedef std::multimap<key_type, time_type> times;

        static __int64 TimerFreq();

        LARGE_INTEGER startTime_, stopTime_;
        mutable LARGE_INTEGER intermediateTime_;
        std::string label_;

        static times& TimeMap();

        struct extract_key : public std::unary_function<times::value_type, key_type>
        {
            std::string operator()(times::value_type const & r) const
            {
                return r.first;
            }
        };

        struct extract_val : public std::unary_function<times::value_type, time_type>
        {
            time_type operator()(times::value_type const & r) const
            {
                return r.second;
            }
        };
        struct match_key : public std::unary_function<times::value_type, bool>
        {
            match_key(key_type const & key_) : key(key_) {};
            bool operator()(times::value_type const & rhs) const
            {
                return key == rhs.first;
            }
            match_key& operator=(const match_key& rhs)
            {
                key = rhs.key;
                return * this;
            }
        protected:
            key_type key;
        };

        struct accum_key : public std::binary_function<time_type, times::value_type, time_type>
        {
            accum_key(key_type const & key_) : key(key_), n(0) {};
            time_type operator()(time_type const & v, times::value_type const & rhs) const
            {
                if( key == rhs.first )
                {
                    ++n;
                    return rhs.second + v;
                }
                return v;
            }
        private:
            times::key_type key;
            mutable size_t n;
        };
    };

    inline Timer::Timer(const std::string & name)
    {
        label_ = name;
        QueryPerformanceCounter(&startTime_);
    }

    inline double Timer::current_elapsed() const
    {
        QueryPerformanceCounter(&intermediateTime_);
        __int64 clocks = intermediateTime_.QuadPart-startTime_.QuadPart;
        double elapsed = (double)clocks/(double)TimerFreq();
        return elapsed;
    }

    inline Timer::~Timer()
    {
        double elapsed = current_elapsed();
        stopTime_.QuadPart = intermediateTime_.QuadPart;
        TimeMap().insert(std::make_pair(label_,elapsed));
    };

    inline Timer& Timer::operator=(const std::string& name)
    {
        double elapsed = current_elapsed();
        stopTime_.QuadPart = intermediateTime_.QuadPart;
        TimeMap().insert(std::make_pair(label_,elapsed));
        label_ = name;
        QueryPerformanceCounter(&startTime_);
        return * this;
    }

    inline Timer::Timer(const Timer& rhs)
    {
        double elapsed = current_elapsed();
        stopTime_.QuadPart = intermediateTime_.QuadPart;
        TimeMap().insert(std::make_pair(label_,elapsed));
        label_ = rhs.label_;
        QueryPerformanceCounter(&startTime_);
    }

    inline std::string Timer::format_now() const
    {
        return format_elapsed(current_elapsed());
    }

    inline std::string Timer::DumpTrials(bool ClipboardAlso)
    {
        using boost::io::group;

        if( TimeMap().empty() )
        {
            return "No trials\r\n";
        }

        std::string ret = (boost::format("\r\n\r\nTimer Precision = %s\r\n\r\n")
            % format_elapsed(1.0/(double)TimerFreq())).str();

        // get a list of keys
        typedef std::set<std::string> keyset;
        keyset keys;
        std::transform(TimeMap().begin(), TimeMap().end(), std::inserter(keys, keys.begin()), extract_key());

        size_t maxrows = 0;

        typedef std::vector<std::string> strings;
        strings lines;

        static const size_t t = 9;

        std::string head = 
            (boost::format("=== %-s %-s %-s %-s %-s %-s ===") 
            //% (t*2) 
            //% (t*2) 
            % group(std::setw(t*2), std::setprecision(t*2), "Item" )
            //% t 
            //% t 
            % group(std::setw(t), std::setprecision(t), "Trials")
            //% t 
            //% t 
            % group(std::setw(t), std::setprecision(t),  "Ttl Time" )
            //% t 
            //% t 
            % group(std::setw(t), std::setprecision(t), "Avg Time" )
            //% t 
            //% t 
            % group(std::setw(t), std::setprecision(t),  "Mean Time" )
            //% t 
            //% t 
            % group(std::setw(t), std::setprecision(t),  "StdDev")
            ).str();

        ret += (boost::format("\r\n%s\r\n") % head).str();
        if( ClipboardAlso ) 
            lines.push_back("Item\tTrials\tTtl Time\tAvg Time\tMean Time\tStdDev\r\n");
        // dump the values for each key
        for( keyset::iterator key = keys.begin(); keys.end() != key; ++key )
        {
            time_type ttl = 0;
            ttl = std::accumulate(TimeMap().begin(), TimeMap().end(), ttl, accum_key(*key));
            size_t num = std::count_if( TimeMap().begin(), TimeMap().end(), match_key(*key));
            if( num > maxrows ) 
                maxrows = num;
            time_type avg = ttl / num;

            // compute mean
            std::vector<time_type> sortedTimes;
            dibcore::stl::transform_if(TimeMap().begin(), TimeMap().end(), std::inserter(sortedTimes, sortedTimes.begin()), extract_val(), match_key(*key));
            std::sort(sortedTimes.begin(), sortedTimes.end());
            size_t mid = (size_t)floor((double)num/2.0);
            double mean = ( num > 1 && (num % 2) != 0 ) ? (sortedTimes[mid]+sortedTimes[mid+1])/2.0 : sortedTimes[mid];

            // compute variance
            double sum = 0.0;
            if( num > 1 )
            {
                for( std::vector<time_type>::iterator cur = sortedTimes.begin(); sortedTimes.end() != cur; ++cur )
                    sum += pow(*cur-mean,2.0);
            }

            // compute std dev
            double stddev = num > 1 ? sqrt(sum/((double)num-1.0)) : 0.0;

            ret += (boost::format("    %-s %-s %-s %-s %-s %-s\r\n") 
                % group(std::setw(t*2), std::setprecision(t*2) , (*key))
                % group(std::setw(t), std::setprecision(t) , (boost::format("%d") %num).str() )
                % group(std::setw(t), std::setprecision(t) , format_elapsed(ttl).c_str() )
                % group(std::setw(t), std::setprecision(t) , format_elapsed(avg) )
                % group(std::setw(t), std::setprecision(t) , format_elapsed(mean) )
                % group(std::setw(t), std::setprecision(t) , format_elapsed(stddev)) ).str(); 

            if( ClipboardAlso )
                lines.push_back((
                boost::format("%s\t%s\t%s\t%s\t%s\t%s\r\n") 
                % (*key )
                % (boost::format("%d") %num)
                % format_elapsed(ttl) 
                % format_elapsed(avg) 
                % format_elapsed(mean)
                % format_elapsed(stddev)
                ).str());


        }
        ret += (boost::format("%s\r\n") 
            % std::string(head.length(),'=') ).str();

        if( ClipboardAlso )
        {
            // dump header row of data block
            lines.push_back("");
            {
                std::string s;
                for( keyset::iterator key = keys.begin(); key != keys.end(); ++key )
                {
                    if( key != keys.begin() )
                        s.append("\t");
                    s.append(*key);
                }
                s.append("\r\n");
                lines.push_back(s);
            }

            // blow out the flat map of time values to a seperate vector of times for each key
            typedef std::map<std::string, std::vector<time_type> > nodematrix;
            nodematrix nodes;
            for( times::iterator time = TimeMap().begin(); time != TimeMap().end(); ++time )
                nodes[time->first].push_back(time->second);

            // dump each data point
            for( size_t row = 0; row < maxrows; ++row )
            {
                std::string rowDump;
                for( keyset::iterator key = keys.begin(); key != keys.end(); ++key )
                {
                    if( key != keys.begin() )
                        rowDump.append("\t");
                    if( nodes[*key].size() > row )
                        rowDump.append((
                        boost::format("%f") 
                        % nodes[*key][row]
                    ).str());
                }
                rowDump.append("\r\n");
                lines.push_back(rowDump);
            }

            // dump to the clipboard
            std::string dump;
            for( strings::iterator s = lines.begin(); s != lines.end(); ++s )
            {
                dump.append(*s);
            }

            OpenClipboard(0);
            EmptyClipboard();
            HGLOBAL hg = GlobalAlloc(GMEM_MOVEABLE, dump.length()+1);
            if( hg )
            {
                char* buf = (char*)GlobalLock(hg);
                if( buf )
                {
                    std::copy(dump.begin(), dump.end(), buf);
                    buf[dump.length()] = 0;
                }
                GlobalUnlock(hg);
                SetClipboardData(CF_TEXT, hg);
            }
            CloseClipboard();
        }

        return ret;
    }

    inline std::string Timer::format_elapsed(double d) 
    {
        if( d < 0.00000001 )
        {
            // show in ps with 4 digits
            return (boost::format("%0.4f ps") % (d * 1000000000000.0)).str();
        }
        if( d < 0.00001 )
        {
            // show in ns
            return (boost::format("%0.0f ns")% (d * 1000000000.0)).str();
        }
        if( d < 0.001 )
        {
            // show in us
            return (boost::format("%0.0f us") % (d * 1000000.0)).str();
        }
        if( d < 0.1 )
        {
            // show in ms
            return (boost::format("%0.0f ms") % (d * 1000.0)).str();
        }
        if( d <= 60.0 )
        {
            // show in seconds
            return (boost::format("%0.2f s") % d).str();
        }
        if( d < 3600.0 )
        {
            // show in min:sec
            return (boost::format("%01.0f:%02.2f") % floor(d/60.0) % fmod(d,60.0)).str();
        }
        // show in h:min:sec
        return (boost::format("%01.0f:%02.0f:%02.2f") % floor(d/3600.0) % floor(fmod(d,3600.0)/60.0) % fmod(d,60.0)).str();
    }

    inline void Timer::Reset()
    {
        TimeMap().clear();
    }

    inline __int64 Timer::TimerFreq()
    {
        static __int64 freq = 0;
        static bool init = false;
        if( !init )
        {
            LARGE_INTEGER li;
            QueryPerformanceFrequency(&li);
            freq = li.QuadPart;
            init = true;
        }
        return freq;
    }

    inline Timer::times& Timer::TimeMap()
    {
        static times times_;
        return times_;
    } 
};  // namespace dbg
 Martin Beckett20 янв. 2011 г., 18:22
Да, я упростил его, просто выделив фиксированный буфер из 1024 событий со временем и тегом сообщения char [] фиксированной длины. Тогда вызов по метке времени очень дешев.
 Gene Bushuyev18 янв. 2011 г., 19:40
Да, я думаю, мы все это сделали. Однако проблема с этим профилированием заключается в том, что из-за медленных операций (особенно new ()), которые вводит код профилирования, я обнаружил, что бесполезно профилировать жесткий шаблонный код. Кроме того, когда создаются такие тяжелые объекты профиля, компилятор прекращает вставку, и ваши результаты будут полностью отключены.
 John Dibling18 янв. 2011 г., 19:24
@Martin: Пожалуйста, надеюсь, это поможет. Одна быстрая заметка, которую я забыл упомянуть. В этом классе есть много вещей, которые я почти никогда не использую, но думал, что смогу. Одним из них является возможность также копировать результаты дампа в буфер обмена Windows. Это дефолтfalse параметр вDumpTrials()
 Martin Beckett18 янв. 2011 г., 19:06
Отлично спасибо
 John Dibling18 янв. 2011 г., 19:52
@Gene: Как я уже сказал, акт времени сам изменит результаты. Цель этого устройства не в том, чтобы точно сказать, сколько времени занимает выполнение определенного блока кода. В любом случае, такое устройство было бы бессмысленным, поскольку код будет занимать больше или меньше времени в зависимости от машины, других процессов, набора данных и т. Д. Даже температуры процессора. Цель состоит в том, чтобы дать вам оценку времени выполнения относительно других частей кода. Для этой цели он хорошо послужил мне во всех видах кода.

Ваш ответ на вопрос