Android上的实时电话字幕/转录(语音到文本)
这个问题是为了帮助“重听社区”,让他们能够阅读电话/手机通话,因为他们听不见。 Android 11提供了一个API“AudioPlaybackCaptureConfiguration”。此API使应用程序能够复制其他应用程序正在播放的音频 谷歌也在像素手机上实现了与shownn相同的功能。但它几乎没有限制-Android上的实时电话字幕/转录(语音到文本),android,speech-to-text,Android,Speech To Text,这个问题是为了帮助“重听社区”,让他们能够阅读电话/手机通话,因为他们听不见。 Android 11提供了一个API“AudioPlaybackCaptureConfiguration”。此API使应用程序能够复制其他应用程序正在播放的音频 谷歌也在像素手机上实现了与shownn相同的功能。但它几乎没有限制- 它只支持英语,如何支持区域语言 当前的实现使用本地移动引擎将语音转换为文本,即语音不会发送到google服务器(所有处理都在移动设备本身离线进行),因此准确性也很低 在这里看到了很多帖子之
我们是否可以根据我们的要求修改Android源代码本身,并消除该限制,以便即使需要构建定制的Android操作系统,我们也可以实现我们想要做的事情?这个问题并不具体。你有什么问题?您不知道如何获取呼叫的音频流吗?回放捕获不能识别音频流中的声音吗?@ USER 3252444——我想捕获呼叫者的声音(请注意它将被视为系统调用),我认为Android目前不提供任何捕获呼叫者声音的选项,我们可以将其输入到字幕写入应用程序中(例如谷歌现场抄本)。