Como fazer testes de unidade “baseados em desempenho” (benchmark) em Python

Digamos que eu tenho minha base de códigos com o mais alto grau de cobertura de teste de unidade que faz sentido. (Além de um certo ponto, aumentar a cobertura não tem um bom ROI.)

Próximo Quero testar o desempenho. Para comparar o código para garantir que as novas confirmações não estejam atrasando as coisas desnecessariamente. Fiquei muito intrigado com o Safariolítica de tolerância zero para lentidão de confirmações. Não tenho certeza de que o nível de comprometimento com a velocidade tenha um bom ROI para a maioria dos projetos, mas eu gostaria de pelo menos ser alertado de que ocorreu uma regressão da velocidade e poder fazer um julgamento sobre isso.

@ Environment é Python no Linux, e uma sugestão que também era viável para scripts BASH me deixaria muito feliz. (Mas Python é o foco principal.)

questionAnswers(4)

yourAnswerToTheQuestion