Postgres Langsame Gruppierung nach Abfrage mit max

Ich verwende Postgres 9.1 und habe eine Tabelle mit etwa 3,5 Millionen Zeilen mit Ereignistyp (Varchar) und Ereigniszeit (Zeitstempel) - und einigen anderen Feldern. Es gibt nur ca. 20 verschiedene Veranstaltungstypen und die Veranstaltungsdauer beträgt ca. 4 Jahre.

Ich möchte den letzten Zeitstempel jedes Ereignistyps erhalten. Wenn ich eine Abfrage wie folgt ausführe:

select eventtype, max(eventtime)
from allevents
group by eventtype

es dauert ungefähr 20 Sekunden. Die Auswahl eines bestimmten Ereignistyps ist ebenso langsam. Der Abfrageplan zeigt einen vollständigen sequentiellen Scan der Tabelle - nicht überraschend, dass er langsam ist.

Erklären Sie Analyse für die obige Abfrage gibt:

HashAggregate  (cost=84591.47..84591.68 rows=21 width=21) (actual time=20918.131..20918.141 rows=21 loops=1)
  ->  Seq Scan on allevents  (cost=0.00..66117.98 rows=3694698 width=21) (actual time=0.021..4831.793 rows=3694392 loops=1)
Total runtime: 20918.204 ms

Wenn ich eine where-Klausel hinzufüge, um einen bestimmten Ereignistyp auszuwählen, dauert es irgendwo zwischen 40 ms und 150 ms, was mindestens anständig ist.

Abfrageplan bei Auswahl eines bestimmten Ereignistyps:

GroupAggregate  (cost=343.87..24942.71 rows=1 width=21) (actual time=98.397..98.397 rows=1 loops=1)
  ->  Bitmap Heap Scan on allevents  (cost=343.87..24871.07 rows=14325 width=21) (actual time=6.820..89.610 rows=19736 loops=1)
        Recheck Cond: ((eventtype)::text = 'TEST_EVENT'::text)
        ->  Bitmap Index Scan on allevents_idx2  (cost=0.00..340.28 rows=14325 width=0) (actual time=6.121..6.121 rows=19736 loops=1)
              Index Cond: ((eventtype)::text = 'TEST_EVENT'::text)
Total runtime: 98.482 ms

Primärschlüssel ist (Ereignistyp, Ereigniszeit). Ich habe auch die folgenden Indizes:

allevents_idx (event time desc, eventtype)
allevents_idx2 (eventtype).

Wie kann ich die Abfrage beschleunigen?

Die Ergebnisse des Abfragespiels für die von @denis unten vorgeschlagene korrelierte Unterabfrage mit 14 manuell eingegebenen Werten ergeben:

Function Scan on unnest val  (cost=0.00..185.40 rows=100 width=32) (actual time=0.121..8983.134 rows=14 loops=1)
   SubPlan 2
     ->  Result  (cost=1.83..1.84 rows=1 width=0) (actual time=641.644..641.645 rows=1 loops=14)
          InitPlan 1 (returns $1)
             ->  Limit  (cost=0.00..1.83 rows=1 width=8) (actual time=641.640..641.641 rows=1 loops=14)
                  ->  Index Scan using allevents_idx on allevents  (cost=0.00..322672.36 rows=175938 width=8) (actual time=641.638..641.638 rows=1 loops=14)
                         Index Cond: ((eventtime IS NOT NULL) AND ((eventtype)::text = val.val))
Total runtime: 8983.203 ms

Unter Verwendung der von @jjanes vorgeschlagenen rekursiven Abfrage wird die Abfrage mit dem folgenden Plan zwischen 4 und 5 Sekunden ausgeführt:

CTE Scan on t  (cost=260.32..448.63 rows=101 width=32) (actual time=0.146..4325.598 rows=22 loops=1)
  CTE t
    ->  Recursive Union  (cost=2.52..260.32 rows=101 width=32) (actual time=0.075..1.449 rows=22 loops=1)
          ->  Result  (cost=2.52..2.53 rows=1 width=0) (actual time=0.074..0.074 rows=1 loops=1)
            InitPlan 1 (returns $1)
                  ->  Limit  (cost=0.00..2.52 rows=1 width=13) (actual time=0.070..0.071 rows=1 loops=1)
                        ->  Index Scan using allevents_idx2 on allevents  (cost=0.00..9315751.37 rows=3696851 width=13) (actual time=0.070..0.070 rows=1 loops=1)
                              Index Cond: ((eventtype)::text IS NOT NULL)
          ->  WorkTable Scan on t  (cost=0.00..25.58 rows=10 width=32) (actual time=0.059..0.060 rows=1 loops=22)
                Filter: (eventtype IS NOT NULL)
                SubPlan 3
                  ->  Result  (cost=2.53..2.54 rows=1 width=0) (actual time=0.059..0.059 rows=1 loops=21)
                        InitPlan 2 (returns $3)
                          ->  Limit  (cost=0.00..2.53 rows=1 width=13) (actual time=0.057..0.057 rows=1 loops=21)
                                ->  Index Scan using allevents_idx2 on allevents  (cost=0.00..3114852.66 rows=1232284 width=13) (actual time=0.055..0.055 rows=1 loops=21)
                                      Index Cond: (((eventtype)::text IS NOT NULL) AND ((eventtype)::text > t.eventtype))
  SubPlan 6
    ->  Result  (cost=1.83..1.84 rows=1 width=0) (actual time=196.549..196.549 rows=1 loops=22)
          InitPlan 5 (returns $6)
            ->  Limit  (cost=0.00..1.83 rows=1 width=8) (actual time=196.546..196.546 rows=1 loops=22)
                  ->  Index Scan using allevents_idx on allevents  (cost=0.00..322946.21 rows=176041 width=8) (actual time=196.544..196.544 rows=1 loops=22)
                        Index Cond: ((eventtime IS NOT NULL) AND ((eventtype)::text = t.eventtype))
Total runtime: 4325.694 ms

Antworten auf die Frage(3)

Ihre Antwort auf die Frage