Dialogflow es 接收DialogFlow结果时出现延迟,句子很短

Dialogflow es 接收DialogFlow结果时出现延迟,句子很短,dialogflow-es,Dialogflow Es,我从Android客户端的麦克风向nodejs服务器传输数据流 (由我构建),它将音频转发给DialogFlow代理。 nodejs服务器的流式代码基于以下代码段: nodejs中的服务器首先接收中间结果(自动语音识别的单词) 识别-ASR),然后是DialogFlow(使用NLU)的最终结果 分析)。Android客户端和nodejs之间的连接协议 服务器是websocket 我面临的问题是 当我播放短句的音频时(在我的例子中是 意大利语“sì”/“no”中的单词),dialogFlow的最终

我从Android客户端的麦克风向nodejs服务器传输数据流 (由我构建),它将音频转发给DialogFlow代理。 nodejs服务器的流式代码基于以下代码段:

nodejs中的服务器首先接收中间结果(自动语音识别的单词) 识别-ASR),然后是DialogFlow(使用NLU)的最终结果 分析)。Android客户端和nodejs之间的连接协议 服务器是websocket

我面临的问题是 当我播放短句的音频时(在我的例子中是 意大利语“sì”/“no”中的单词),dialogFlow的最终结果 有时会出现接近10秒的延迟

我从第一个部分ASR结果到达时开始测量最终DialogFlow结果的延迟。 所以我的实验是这样进行的:

  • 我打开麦克风开始说话(我只是说“sì”或“否”)
  • 第一个中间结果到达(计时器启动)
  • DialogFlow的最终结果到达(计时器停止)
语音识别的中间结果几乎可以达到 立即,也就是说,延迟非常小

对于DialogFlow最终结果到达的延迟, 大约每两次就有一次结果会在4秒钟内到达,即 可以接受,否则需要更长的时间(在最坏的情况下,即使是10 或延迟11秒)。在后一种情况下,延迟是不可接受的 因为用户体验太慢了

我必须再次指出,这个问题只是在极短的时间内发现的 句子。对于由几个音节的单词组成的句子 DialogFlow的延迟总是可以忽略的,而且一切都很好

我也试过使用英语模型,但句子由 “是”和“否”遭受同样的延迟。我还做了一些测试 不是默认的模型(特别是我尝试了这个模型
命令和搜索
,被描述为“最适合短查询” 例如语音命令或语音搜索”),但没有运气

我知道使用“是”和“否”这样的短句是不正确的 然而,对于DialogFlow代理来说,这不是最常见的用例 相信在某些情况下它是有用的(有时 (必要的)使用它们

所以我问是否有人经历过这个问题,知道如何克服 它