Przyspieszenie przepływu danych TPL?

Zastanawiam się, czy poniższy kod może zostać zoptymalizowany do szybszego wykonywania. Wydaje mi się, że obecnie maksymalnie około 1,4 miliona prostych komunikatów na sekundę pochodzi z całkiem prostej struktury przepływu danych. Zdaję sobie sprawę, że ten przykładowy proces przesyła / transformuje komunikaty synchronicznie, jednak obecnie testuję TPL Dataflow jako możliwy zamiennik dla mojego niestandardowego rozwiązania opartego na zadaniach i kolekcjach współbieżnych. Wiem, że terminy „współbieżny” już sugerują, że uruchamiam rzeczy równolegle, ale na potrzeby bieżących testów wysyłałem wiadomości na własne rozwiązanie synchronicznie i otrzymuję około 5,1 miliona wiadomości na sekundę. Czego mi brakuje tutaj, przeczytałem TPL Dataflow został przesunięty jako rozwiązanie o wysokiej przepustowości i niskiej latencji, ale jak dotąd muszę pomijać poprawki wydajności. Czy ktoś może wskazać mi właściwy kierunek?

class TPLDataFlowExperiments
{
    public TPLDataFlowExperiments()
    {
        var buf1 = new BufferBlock<int>();

        var transform = new TransformBlock<int, string>(t =>
            {
                return "";
            });

        var action = new ActionBlock<string>(s =>
            {
                //Thread.Sleep(100);
                //Console.WriteLine(s);
            });

        buf1.LinkTo(transform);
        transform.LinkTo(action);

        //Propagate all Completions down the flow
        buf1.Completion.ContinueWith(t =>
        {
            transform.Complete();
            transform.Completion.ContinueWith(u =>
            {
                action.Complete();
            });
        });

        Stopwatch watch = new Stopwatch();
        watch.Start();

        int cap = 10000000;
        for (int i = 0; i < cap; i++)
        {
            buf1.Post(i);
        }

        //Mark Buffer as Complete
        buf1.Complete();

        action.Completion.ContinueWith(t =>
            {
                watch.Stop();

                Console.WriteLine("All Blocks finished processing");
                Console.WriteLine("Units processed per second: " + cap / watch.ElapsedMilliseconds * 1000);
            });

        Console.ReadLine();
    }
}

questionAnswers(3)

yourAnswerToTheQuestion