O que é FLOP / s e é uma boa medida de desempenho?

Me pediram para medir o desempenho de um programa fortran que resolve equações diferenciais em um sistema com várias CPUs. Meu empregador insiste em que eu avalie FLOP / s (operações flutuantes por segundo) e compare os resultados com benchmarks (LINPACK), mas não estou convencido de que esse seja o caminho a seguir, simplesmente porque ninguém pode me explicar o que é um FLOP.

Eu fiz algumas pesquisas sobre o que exatamente é um FLOP e recebi algumas respostas bastante contraditórias. Uma das respostas mais populares que recebi foi '1 FLOP = Uma operação de adição e multiplicação'. Isso é verdade? Se sim, novamente, fisicamente, o que exatamente isso significa?

Qualquer que seja o método que eu acabe usando, ele deve ser escalável. Algumas versões do código resolvem sistemas com milhões de incógnitas e levam dias para serem executadas.

Quais seriam outras maneiras eficazes de medir o desempenho no meu caso (o resumo do meu caso é 'código fortran que faz muitos cálculos aritméticos repetidamente durante dias em várias centenas de CPUs)?

questionAnswers(8)

yourAnswerToTheQuestion