如何在PHP web应用程序中实现Mozilla DeepSpeech以将语音转换为文本？_Php_Speech Recognition_Speech To Text_Webspeech Api_Mozilla Deepspeech

如何在PHP web应用程序中实现Mozilla DeepSpeech以将语音转换为文本？

php speech-recognition

如何在PHP web应用程序中实现Mozilla DeepSpeech以将语音转换为文本？,php,speech-recognition,speech-to-text,webspeech-api,mozilla-deepspeech,Php,Speech Recognition,Speech To Text,Webspeech Api,Mozilla Deepspeech,我有一个PHP web应用程序，正在寻找一个开源的、高精度的语音到文本识别实现，它将使用语音命令从用户处打开网页。示例：“生成销售”（这将打开创建销售PHP页面）、“生成采购订单”、“打开日终报告”等我的问题：我想知道我们是否可以使用从Firefox浏览器获取.wav音频并将语音返回到文本。如果是，使用麦克风从Firefox录制语音到使用DeepSpeech引擎转换文本的流程是什么如何进行类似于“OK-GOOGLE”的唤醒/启动呼叫，以便随时收听命令？请阅读：从语音到文本的翻译在客户端

我有一个PHP web应用程序，正在寻找一个开源的、高精度的语音到文本识别实现，它将使用语音命令从用户处打开网页。示例：“生成销售”（这将打开创建销售PHP页面）、“生成采购订单”、“打开日终报告”等

我的问题：

我想知道我们是否可以使用从Firefox浏览器获取.wav音频并将语音返回到文本。如果是，使用麦克风从Firefox录制语音到使用DeepSpeech引擎转换文本的流程是什么

如何进行类似于“OK-GOOGLE”的唤醒/启动呼叫，以便随时收听命令？

请阅读：

从语音到文本的翻译在客户端的浏览器中完成。

生成文本后，可以使用jquery将其发送到php服务器。

您可以通过创建服务器并使用辅助请求/AJAX或web套接字来回发送请求来实现这一点

您可以使用以下链接查找服务器安装说明：

安装服务器后，您可以开始从任何支持“WebRTC API:getUserMedia（）”的浏览器发出请求。生成音频Blob数据并将其以base64格式发送到后端服务器。在后端，将blob保存到临时音频文件：

$encodedData = base64_decode($data); 

// write the data out to the file
$fp = fopen($full_file_path, 'wb');
      fwrite($fp, $encodedData);
      fclose($fp);

然后通过向您自己的Mozzila DeepSpeech Node.js服务器发出CURL请求，将音频文件转换为文本：

curl -X POST --data-binary @testfile.wav http://localhost:8080/stt

在后端创建方法来循环生成的文本，并尝试识别关键字/命令。如果触发，将其发送回前端。也许您只是想授予用户使用语音编写长消息的能力每次返回全文。但是，您仍然希望“倾听”关键词，以便让用户能够设置标点、开始和完成写作

祝大家快乐；）

我想我已经试过了，但找不到任何合适的API。看起来这应该是可能的，但我肯定没有看到任何实现指南。看起来你只是想弄明白事情的结构应该是怎样的——这绝对是一个有趣的问题。上周，我正在与CI合作的一个家庭自动化项目中研究这一点，当时我正试图对此进行思考。请在这里解释您的答案，不要只依赖于链接共享。问题是如何使用PHP服务器和mozilla deepspeech API从浏览器转换生成的音频，所以，然后将结果发送回前端。