So erkennen Sie eine Phrase aus einer Sprachdatei

Wie kann die Engine eine Phrase aus einer Sprachdatei (wav / mp3 / etc ..) erfolgreich erkennen?

Zum Beispiel, wenn ich eine Sprachdatei und einen geschriebenen Text des Kontexts derselben Datei habe, damit er die geschriebenen Wörter in der Sprachdatei erkennt.

Ich habe versucht, mit der SpeechRecognitionEngine herumzuspielen, aber bisher ohne Erfolg.

Ich freue mich über Ideen, da ich mich zum ersten Mal mit Spracherkennungstechniken beschäftige.

Ich habe Beispiele für die Verwendung von Wörterbüchern in Textform gesehen, bin mir jedoch nicht sicher, wie dies hier nützlich sein kann. Ich dachte daran, die gesamte Sprachdatei in Text umzuwandeln und dann einfach nach der spezifischen Phrase in diesem Text zu suchen, aber ich denke nicht, dass dies der richtige Weg ist. Es scheint nicht sinnvoll zu sein, zum Beispiel eine 5-stündige Sprachausgabe in Text umzuwandeln ... oder die spezifische Phrase als "Wörterbuch" zu verwenden und nach diesem Element in der Sprachdatei zu suchen.

Antworten auf die Frage(3)

Ihre Antwort auf die Frage