Другой способ - использовать массив микрофонов и различать положения и направления вокальных источников. Я считаю, что это более простой подход, поскольку расчет положения гораздо менее сложен, чем отделение разных колонок от источника моно или стерео.

могу отличить двух говорящих людей? Например, если кто-то говорит «привет», а другой - «привет», какую подпись я должен искать в аудиоданных? периодичность?

Большое спасибо всем, кто может ответить на это!

Ответы на вопрос(4)

Ваш ответ на вопрос