Speech recognition 有没有办法使用Alexa或DialogFlow.ai等技术来使用原始音频数据?

Speech recognition 有没有办法使用Alexa或DialogFlow.ai等技术来使用原始音频数据?,speech-recognition,alexa,web-audio-api,speech-to-text,voice-recognition,Speech Recognition,Alexa,Web Audio Api,Speech To Text,Voice Recognition,我正在开发一个应用程序,使用语音识别来帮助盲人学习音乐。为此,我考虑使用DialogFlow.ai,甚至AmazonAlexa这样的东西,以避免重新启动轮子。因此,有时我想使用原始音频数据来检查乐器是否调谐。使用这些技术,默认情况下,所有音频输入都会被解释,并因此转换为文本。那么,有没有一种方法可以使用原始音频数据而不是解释用户的语音?原因有很多,主要是亚马逊Alexa和其他类似技术不允许您获取用户的原始输入。使用Amazon Alexa作为捕获乐器音频输入的一种方式并不是实现调谐器的一种可行的

我正在开发一个应用程序,使用语音识别来帮助盲人学习音乐。为此,我考虑使用DialogFlow.ai,甚至AmazonAlexa这样的东西,以避免重新启动轮子。因此,有时我想使用原始音频数据来检查乐器是否调谐。使用这些技术,默认情况下,所有音频输入都会被解释,并因此转换为文本。那么,有没有一种方法可以使用原始音频数据而不是解释用户的语音?

原因有很多,主要是亚马逊Alexa和其他类似技术不允许您获取用户的原始输入。使用Amazon Alexa作为捕获乐器音频输入的一种方式并不是实现调谐器的一种可行的方式。您应该实现自己的方式来捕获音频,并可能将其与Alexa/DialogFlow一起用于命令解释