Прототип на основе распознавания речи

Я хочу создать прототип, основанный на автоматическом распознавании речи для работы с отчетами.

Требования сейчас не определены, но сначала я получу несколько фиктивных наборов данных. И сначала я сконцентрируюсь на вводе акустических сигналов и дальнейшей обработке.

Я действительно не знаю, с чего начать, какая среда разработки, язык программирования, ...

Я бы предпочел работать с visual studio, потому что у меня уже есть лицензия, но я открыт для предложений.

У вас есть учебники, идеи, опыт?

Ответы на вопрос(1)

Решение Вопроса

(Я повторно использую электронное письмо, которое я недавно отправил другу. Я надеюсь, что это полезно)

У Microsoft есть две разновидности речевых движков: Desktop и Server. Речевой движок настольного компьютера поставлялся с различными продуктами, включая: MS Office 2003, Windows Vista и Windows 7. Речевой движок сервера поставлялся с Office Communications Server (OCS) и Управляемым API унифицированных коммуникаций (UCMA).

Настольный речевой движок обычно поставляется с грамматикой диктовки. Он оптимизирован для использования на рабочем столе и может использоваться несколькими процессами. Это позволит вам использовать один экземпляр распознавателя рабочего стола и выполнять голосовые команды для Excel и Word. Распознаватель рабочего стола может быть запрограммирован через API-интерфейс COM SAPI или пространство имен .NET System.Speech.

Сервер речи не поставляется с любой грамматикой. Он оптимизирован для использования на сервере. Я считаю, что он оптимизирован и для телефонии. Он предназначен для сценариев большого объема. Серверный речевой механизм может быть запрограммирован через API-интерфейс COM SAPI или пространство имен .NET Microsoft.Speech.

Речевой движок сервера упакован в новый бесплатный распространяемый пакет под названием «Речевая платформа Microsoft Server». Я предполагаю, что следующая версия OCS (продукт с именем Lync -http://www.microsoft.com/en-us/lync/default.aspx) также будет включать в себя ту же платформу Microsoft Server Speech.

Microsoft Server Speech Platform доступна для бесплатной распространяемой загрузки. Он состоит из трех частей: SDK, среда выполнения и языки. Доступно 26 языков. Увидетьhttp://blogs.msdn.com/b/speak/archive/2010/03/30/microsoft-server-speech-platform-10-1-released-sr-and-tts-in-26-languages.aspx для некоторого фона. После публикации этого блога Microsoft незаметно выпустила обновленную 10.2 версию Microsoft Server Speech Platform. Они также доступны для скачивания по адресу:

SDK:http://www.microsoft.com/downloads/en/details.aspx?FamilyID=1b1604d3-4f66-4241-9a21-90a294a5c9a4&displaylang=en

Runtime:http://www.microsoft.com/downloads/en/details.aspx?FamilyID=bb0f72cb-b86b-46d1-bf06-665895a313c7&displaylang=en

Языки:http://www.microsoft.com/downloads/en/details.aspx?FamilyID=47ffd4e5-e682-4228-8058-dd895252a3c3&displaylang=en

 Michael Levy07 окт. 2010 г., 15:54
Как уже упоминалось в другом вопросе, который вы опубликовали, см. Устаревшую, но полезную статью MSDN наmsdn.microsoft.com/en-us/magazine/cc163663.aspx
 Michael Levy07 окт. 2010 г., 15:52
Он предоставляет .NET API. Вы можете использовать любой язык .NET и Visual Studio.
 Tyzak07 окт. 2010 г., 12:10
и на каком языке программирования я могу продолжать?

Ваш ответ на вопрос