Artificial intelligence 将语音输出解析为JSON以调用应用程序API

Artificial intelligence 将语音输出解析为JSON以调用应用程序API,artificial-intelligence,speech-recognition,Artificial Intelligence,Speech Recognition,这里有一个想法: 我们有web应用程序,这些应用程序具有公开的restful API,可以接受json。现在,使用google语音API将用户语音输入转换为文本,然后以某种方式将文本转换为API所需的JSON,然后用JSON调用这些应用程序APIe,怎么样?有吗。库将文本转换为指定的JSon格式?有人使用过这种方法吗?根据报告,结果集已以JSON格式返回: { "results": [ { "alternatives": [ { "tr

这里有一个想法:

我们有web应用程序,这些应用程序具有公开的restful API,可以接受json。现在,使用google语音API将用户语音输入转换为文本,然后以某种方式将文本转换为API所需的JSON,然后用JSON调用这些应用程序APIe,怎么样?有吗。库将文本转换为指定的JSon格式?有人使用过这种方法吗?

根据报告,结果集已以JSON格式返回:

{
  "results": [
    {
      "alternatives": [
        {
          "transcript": "how old is the Brooklyn Bridge",
          "confidence": 0.98267895
        }
      ]
    }
  ]
}
您所要做的就是使用,然后从对象中选择您想要的内容,并将其转换为特定的json格式

我建议大家通读这篇文章,这被称为“意图分析”。例如,有这样的库

例如,您输入的是“向我展示中国餐馆”。输出将是

{
  "text": "show me chinese restaurants",
  "intent": "restaurant_search",
  "entities": [
    {
      "start": 8,
      "end": 15,
      "value": "chinese",
      "entity": "cuisine"
    }
  ]
}

总的来说,它是非常高级的NLU。

我想他会问如何解析文本和提取语义实体。