sincronizar e realçar texto HTML para áudio

Se necessário, posso explicar com mais detalhes, mas essencialmente o que eu preciso fazer é efetuar alterações de CSS no texto HTML em sincronia com uma faixa de áudio - ou seja, destacar palavras / frases em sincronia com a reprodução de áudio. Eu também preciso controlar a reprodução de áudio, clicando no texto. Eu tenho bons recursos de HTML / CSS, mas não sou tão forte com js brutos, então espero que haja uma abordagem jQuery. Eu espero que alguém possa me guiar na melhor direção.

Muito obrigado antecipadamente,

svs