Речь Фонеме в .Net

Проблема в том, что я хочу получить фонемы аудио речи на языке C #. скажем, у вас есть аудиофайл типа "x.wav", который говорит "привет, дорогой Шамим". Я хочу извлечь все фонемы речи и их относительное время. что-то вроде рисунка ниже:

я использовалSystem.Speech библиотека (обаrecognition а такжеsynthesis пространства имен) но я не нашел то, что хотел. Теперь не ошибайтесь! Я не хочу фонемы предложения «Привет, дорогой Шамим», я хочу извлечь фонемы из неизвестного аудиовхода, который говорит, и английского предложения. Я пыталсяSystem.Speech.Recognition но он пытается извлечь слова из аудиофайла, а не фонемы! и, как вы уже догадались, слова на 30% неверны! ;)

Ответы на вопрос(4)

Ваш ответ на вопрос