Программное обеспечение для распознавания неречевого шума или распознавания звука?

Я работаю над некоторым программным обеспечением для детей и собираюсь добавить способность программного обеспечения реагировать на ряд неречевых звуков. Например, хлопки, лай, свист, пердящий шум и т. Д.

Я использовал CMU Sphinx и Windows Speech API в прошлом, однако, насколько я могу судить, ни один из них не имеет поддержки неречевых шумов, и на самом деле я считаю, что активно отфильтровывать их.

В общем, я ищу «Как мне получить эту функциональность», но я подозреваю, что это может помочь, если я разобью ее на три вопроса, которые являются моими догадками, что искать дальше:

Есть ли способ использовать один из основных механизмов распознавания речи для распознавания несловесных звуков, изменяя акустическую модель или лексику произношения?(или) Существует ли уже существующая библиотека для распознавания шума без слов?(или) Я немного знаком со скрытыми марковскими моделями и базовой технологией распознавания голоса из колледжа, но не могу оценить, насколько сложно было бы создать очень маленький шум / распознаватель звука с нуля (предположим, <20 быть признанным). Если 1) и 2) потерпят неудачу, какая-нибудь оценка того, сколько времени потребуется, чтобы бросить мою собственную?

Спасибо

Ответы на вопрос(2)

Ваш ответ на вопрос