Resultados da pesquisa a pedido "speech-recognition"
A API de reconhecimento de fala do Android não funciona no Android 7 Nougat
Estou usando a API android.speech.SpeechRecognizer para fala. Eu trabalho muito bem no Android 4-5, No Android 6, agora ele tem vários bugs, como o toque que ocorre quando o microfone é ligado é detectado como fala, então ele existe (e faz um ...
AVAudioEngine inputNode installTap falha ao reiniciar a gravação
Estou implementando o reconhecimento de fala no meu aplicativo. Quando apresento pela primeira vez o controlador de exibição com a lógica de reconhecimento de fala, tudo funciona bem. No entanto, quando tento apresentar o controlador de exibição ...
Desativar comandos internos de reconhecimento de fala?
Estou tentando criar um software que interprete vários comandos de texto, tudo de maneira personalizada. Eu uso System.Speech.Recognition e funciona surpreendentemente bem, mas não consigo descobrir como contornar o fato de que sempre que digo ...
Android: reconhecimento de fala sem usar o servidor do Google
Quero desenvolver um reconhecedor de fala no android, que deve funcionar offline. Como o reconhecedor de fala embutido no Android usa o servidor do Google que precisa da Internet, quero uma alternativa que funcione na ausência de ...
Como traçar MFCC em Python?
Eu sou apenas um iniciante aqui no processamento de sinais. Aqui está o meu código até agora para extrair o recurso MFCC de um arquivo de áudio (.WAV): from python_speech_features import mfcc import scipy.io.wavfile as wav (rate,sig) = ...
Qual é a melhor opção para transcrever voz para texto em um aplicativo da web asp.net?
Estou criando um aplicativo da web para gravar mensagens de voz e estou procurando as melhores opções para converter as mensagens de voz em texto. Alguém tem algumas sugestões sobre o que usar para fazer a conversão? O System.Speech funcionaria?
Biblioteca de processamento de fala em Python para fala em texto
Ei, eu estou olhando para construir um código em python que reconhecerá o que falo através do microfone e converter em fala. Você pode me fornecer algumas bibliotecas eficientes de processamento de fala para obter o mesmo?
pyspeech (python) - Transcreva arquivos mp3?
Eu gostaria de transcrever mp3 (fala para texto) usando a API pyspeech. Eu não sei se isso é possível, no entanto. É isso? Quão?
Reconhecimento de alto-falante [fechado]
Como eu poderia diferenciar entre duas pessoas falando? Como se alguém dissesse "olá" e outra pessoa dissesse "olá", que tipo de assinatura devo procurar nos dados de áudio? periodicidade? Muito obrigado a quem puder responder a isso!
Como traduzir a transmissão ao vivo usando a API do Google Speech?
estes são os documentos da API do Google Speech: https://cloud.google.com/speech/docs/sync-recognize [https://cloud.google.com/speech/docs/sync-recognize] Eu tento esta API por 2 semanas. mas ainda não consigo resolver meu objetivo principal ...