¿Qué es FLOP / sy es una buena medida de rendimiento?

Me han pedido que mida el rendimiento de un programa fortran que resuelve ecuaciones diferenciales en un sistema con múltiples CPU. Mi empleador insiste en que mida FLOP / s (operaciones flotantes por segundo) y compare los resultados con los puntos de referencia (LINPACK) pero no estoy convencido de que sea el camino a seguir, simplemente porque nadie puede explicarme qué es un FLOP.

Investigué un poco sobre qué es exactamente un FLOP y obtuve algunas respuestas bastante contradictorias. Una de las respuestas más populares que obtuve fue '1 FLOP = Una operación de suma y multiplicación'. ¿Es eso cierto? Si es así, nuevamente, físicamente, ¿qué significa eso exactamente?

Cualquier método que termine usando, tiene que ser escalable. Algunas de las versiones del código resuelven sistemas con millones de incógnitas y lleva días ejecutarlas.

¿Cuáles serían otras formas efectivas de medir el rendimiento en mi caso (el resumen de mi caso es 'para un código que hace muchos cálculos aritméticos una y otra vez durante días en varios cientos de CPU)?

Respuestas a la pregunta(8)

Su respuesta a la pregunta