como acelerar o discurso na nuvem do google

Question

May 16, 2018, 09:39 AM

google-cloud-platform streaming google-speech-api audio-streaming

como acelerar o discurso na nuvem do google

Estou usando um microfone que grava o som através de um navegador, converte-o em um arquivo e envia o arquivo para um servidor java. Em seguida, meu servidor Java envia o arquivo para a API de fala na nuvem e me fornece a transcrição. O problema é que a transcrição é super longa (em torno de 3,7 segundos para 2 segundos de diálogo).

Então, eu gostaria de acelerar a transcrição. A primeira coisa a fazer é transmitir os dados (se eu iniciar a transcrição no início do registro. O problema é que eu realmente não entendo a API. Por exemplo, se eu quiser transcrever meu fluxo de áudio da fonte ( navegador / microfone) Eu preciso usar algum tipo de API JS, mas não consigo encontrar nada que possa ser usado em um navegador (não podemos usar um nó como esse, podemos?).

Caso contrário, preciso transmitir meus dados dos meus js para o java (não sei como fazê-lo sem interromper os dados ...) e enviá-los através do streamingRecognizeFile a partir daí:https://github.com/GoogleCloudPlatform/java-docs-samples/blob/master/speech/cloud-client/src/main/java/com/example/speech/Recognize.java

Mas é preciso um arquivo como entrada, então como devo usá-lo? Eu realmente não posso dizer ao sistema que terminei ou não o registro ... Como ele entenderá que é o fim da transcrição?

Gostaria de criar algo no meu navegador da Web, como a demonstração do Google:https://cloud.google.com/speech/

Eu acho que há algumas coisas fundamentais que eu não entendo sobre a maneira de usar a API de streaming. Se alguém puder explicar um pouco como eu devo processar isso, seria ótimo.

Obrigado.