Применение нейронной сети к MFCC для речевых сегментов переменной длины

Question

Feb 08, 2014, 11:53 AM

matlab neural-network mfcc speech-recognition

Применение нейронной сети к MFCC для речевых сегментов переменной длины

В настоящее время я пытаюсь создать и обучить нейронную сеть для выполнения простой классификации речи с использованием MFCC.

На данный момент я использую 26 коэффициентов для каждой выборки и в общей сложности 5 разных классов - это пять разных слов с различным количеством слогов.

Несмотря на то, что каждый образец длится 2 секунды, я не уверен, как обращаться со случаями, когда пользователь может произносить слова либо очень медленно, либо очень быстро. Например, слово «телевидение», произнесенное в течение 1 секунды, дает другие коэффициенты, чем слово, произнесенное в течение двух секунд.

Любой совет о том, как я могу решить эту проблему, будет высоко ценится!

Применение нейронной сети к MFCC для речевых сегментов переменной длины

Ответы на вопрос(1)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

Применение нейронной сети к MFCC для речевых сегментов переменной длины

Ответы на вопрос(1)

Ваш ответ на вопрос

Популярные вопросы