econhecimento de alto-falante do Python [fechado]

Tenho um arquivo de áudio (conversa telefônica gravada de 2 pessoas). Preciso separar as vozes de 2 alto-falantes automaticamente. Eu sou novo no reconhecimento de fala e observei o módulo wave de python, mas não consegui encontrar nenhuma informação proveitos

Por favor, ajude como começar. Sugira também bibliotecas python gratuitas que me ajudarão a resolver o problem

questionAnswers(4)

yourAnswerToTheQuestion