Berechnung des Prozentsatzes der Begrenzungsrahmenüberlappung für die Auswertung des Bilddetektors

Beim Testen eines Objekterkennungsalgorithmus in großen Bildern überprüfen wir unsere erkannten Begrenzungsrahmen anhand der für die Grundwahrheitsrechtecke angegebenen Koordinaten.

Entsprechend den Pascal VOC-Herausforderungen gilt Folgendes:

Ein vorhergesagter Begrenzungsrahmen wird als korrekt angesehen, wenn er mehr als 50% mit einem Grundwahrheits-Begrenzungsrahmen überlappt, andernfalls wird der Begrenzungsrahmen als falsch positive Erkennung angesehen. Mehrfacherkennungen werden bestraft. Wenn ein System mehrere Begrenzungsrahmen vorhersagt, die sich mit einem einzigen Begrenzungsrahmen für die Grundwahrheit überlappen, wird nur eine Vorhersage als richtig betrachtet, die anderen werden als falsch positiv betrachtet.

Dies bedeutet, dass wir den Prozentsatz der Überlappung berechnen müssen. Bedeutet dies, dass die Ground-Truth-Box zu 50% von der erkannten Boundary-Box abgedeckt wird? Oder dass 50% der Bounding Box von der Ground Truth Box absorbiert werden?

Ich habe gesucht, aber ich habe keinen Standardalgorithmus dafür gefunden - was überraschend ist, da ich gedacht hätte, dass dies in der Bildverarbeitung etwas ziemlich Übliches ist. (Ich bin neu darin). Habe ich es verpasst Weiß jemand, was der Standardalgorithmus für diese Art von Problem ist?

Antworten auf die Frage(1)

Ihre Antwort auf die Frage