Obteniendo la amplitud máxima para un archivo de audio por segundo

Sé que hay algunas preguntas similares aquí, pero la mayoría de ellas están relacionadas con la generación de formas de onda imágenes, que no es lo que quiero.

Mi objetivo es generar una visualización de forma de onda para un archivo de audio, similar a SoundCloud, pero no una imagen. Me gustaría tener los datos de amplitud máxima por cada segundo (o medio segundo) de un clip de audio en una matriz. Entonces podría usar estos datos para crear una visualización basada en CSS.

Idealmente, me gustaría obtener una matriz que tenga todos los valores de amplitud por segundo como un porcentaje de la amplitud máxima de todo el archivo de audio. Aquí hay un ejemplo:

[
    0.0,  # Relative max amplitude of first second of audio clip (0%)
    0.04,  # Relative max amplitude of second second of audio clip (4%)
    0.15,  # Relative max amplitude of third second of audio clip (15%)
    # Some more
    1.0,  # The highest amplitude of the whole audio clip will be 1.0 (100%)
]

Supongo que tendré que usar al menosnumpy y Python'swave módulo, pero no estoy seguro de cómo obtener los datos que quiero. Me gustaría usar Python, pero no estoy completamente en contra de usar algún tipo de herramienta de línea de comandos.

Respuestas a la pregunta(2)

Su respuesta a la pregunta