¿Cómo categorizar los negativos verdaderos en la detección de objetos de ventana deslizante?

Estoy recopilando resultados de mi algoritmo de detección de imágenes. Básicamente, lo que hago es que, desde un conjunto de imágenes (con el tamaño de 320 x 480), ejecutaría una ventana deslizante de 64x128 a través de ella, y también bajo una serie de escalas predefinidas.

Entiendo que:

Positivos verdaderos = cuando mi ventana detectada se superpone (dentro del tamaño de la intersección / centroide definido) con la verdad de fondo (cuadros delimitadores anotados)Falsos positivos = cuando el algoritmo me da ventanas positivas, que están fuera de la verdad grond.Falsos negativos = cuando no pude dar una ventana positiva, mientras que la anotación de la verdad básica indica que hay un objeto.

Pero que pasaVerdaderos negativos ? ¿Son estos verdaderos negativos todas las ventanas que mi clasificador me da resultados negativos? Eso suena raro, ya que estoy deslizando una pequeña ventana (64x128) por 4 píxeles a la vez, y tengo alrededor de 8 escalas diferentes utilizadas en la detección. Si tuviera que hacer eso, entonces tendría muchos negativos verdaderos por imagen.

O preparo un conjunto de imágenes negativas puras (sin objetos / humano), donde simplemente me deslizo, y si hay una o más detecciones positivas en cada una de estas imágenes, lo contaría como Falso Negativo y viceversa. versa

Aquí hay una imagen de ejemplo (con rects verdes como la verdad fundamental)

Respuestas a la pregunta(2)

Su respuesta a la pregunta