Cálculo del porcentaje de superposición del cuadro delimitador, para la evaluación del detector de imagen

Al probar un algoritmo de detección de objetos en imágenes grandes, verificamos nuestros cuadros delimitadores detectados contra las coordenadas dadas para los rectángulos de verdad del terreno.

Según los desafíos de Pascal VOC, hay esto:

Un cuadro delimitador previsto se considera correcto si se superpone más del 50% con un cuadro delimitador de verdad real; de lo contrario, el cuadro delimitador se considera una detección de falsos positivos. Se penalizan las detecciones múltiples. Si un sistema predice varios cuadros delimitadores que se superponen con un solo cuadro delimitador de verdad fundamental, solo una predicción se considera correcta, las otras se consideran falsos positivos.

Esto significa que necesitamos calcular el porcentaje de superposición. ¿Significa esto que el cuadro de verdad del terreno está cubierto en un 50% por el cuadro límite detectado? ¿O ese 50% del cuadro delimitador es absorbido por el cuadro de verdad del suelo?

He buscado pero no he encontrado un algoritmo estándar para esto, lo cual es sorprendente porque habría pensado que esto es algo bastante común en la visión por computadora. (Soy nuevo en eso). ¿Me lo he perdido? ¿Alguien sabe cuál es el algoritmo estándar para este tipo de problema?

Respuestas a la pregunta(1)

Su respuesta a la pregunta