如何在PHP web应用程序中实现Mozilla DeepSpeech以将语音转换为文本?

如何在PHP web应用程序中实现Mozilla DeepSpeech以将语音转换为文本?,php,speech-recognition,speech-to-text,webspeech-api,mozilla-deepspeech,Php,Speech Recognition,Speech To Text,Webspeech Api,Mozilla Deepspeech,我有一个PHP web应用程序,正在寻找一个开源的、高精度的语音到文本识别实现,它将使用语音命令从用户处打开网页。示例:“生成销售”(这将打开创建销售PHP页面)、“生成采购订单”、“打开日终报告”等 我的问题: 我想知道我们是否可以使用从Firefox浏览器获取.wav音频并将语音返回到文本。如果是,使用麦克风从Firefox录制语音到使用DeepSpeech引擎转换文本的流程是什么 如何进行类似于“OK-GOOGLE”的唤醒/启动呼叫,以便随时收听命令?请阅读: 从语音到文本的翻译在客户端

我有一个PHP web应用程序,正在寻找一个开源的、高精度的语音到文本识别实现,它将使用语音命令从用户处打开网页。示例:“生成销售”(这将打开创建销售PHP页面)、“生成采购订单”、“打开日终报告”等

我的问题

我想知道我们是否可以使用Firefox浏览器获取.wav音频并将语音返回到文本。如果是,使用麦克风从Firefox录制语音到使用DeepSpeech引擎转换文本的流程是什么

如何进行类似于“OK-GOOGLE”的唤醒/启动呼叫,以便随时收听命令?

请阅读:

从语音到文本的翻译在客户端的浏览器中完成。
生成文本后,可以使用jquery将其发送到php服务器。

您可以通过创建服务器并使用辅助请求/AJAX或web套接字来回发送请求来实现这一点

您可以使用以下链接查找服务器安装说明:

安装服务器后,您可以开始从任何支持“WebRTC API:getUserMedia()”的浏览器发出请求。生成音频Blob数据并将其以base64格式发送到后端服务器。 在后端,将blob保存到临时音频文件:

$encodedData = base64_decode($data); 

// write the data out to the file
$fp = fopen($full_file_path, 'wb');
      fwrite($fp, $encodedData);
      fclose($fp);
然后通过向您自己的Mozzila DeepSpeech Node.js服务器发出CURL请求,将音频文件转换为文本:

curl -X POST --data-binary @testfile.wav http://localhost:8080/stt
在后端创建方法来循环生成的文本,并尝试识别关键字/命令。如果触发,将其发送回前端。也许您只是想授予用户使用语音编写长消息的能力每次返回全文。但是,您仍然希望“倾听”关键词,以便让用户能够设置标点、开始和完成写作


祝大家快乐;)

我想我已经试过了,但找不到任何合适的API。看起来这应该是可能的,但我肯定没有看到任何实现指南。看起来你只是想弄明白事情的结构应该是怎样的——这绝对是一个有趣的问题。上周,我正在与CI合作的一个家庭自动化项目中研究这一点,当时我正试图对此进行思考。请在这里解释您的答案,不要只依赖于链接共享。问题是如何使用PHP服务器和mozilla deepspeech API从浏览器转换生成的音频,所以,然后将结果发送回前端。