Database 员工呼叫并提供要保存在数据库中的行程信息

Database 员工呼叫并提供要保存在数据库中的行程信息,database,ibm-watson,Database,Ibm Watson,我想编写一些代码,我的员工可以打电话进来,沃森会问他们重要的问题,他们可以告诉沃森信息,沃森然后将这些信息输出到CSV、XLS等格式,甚至可能是数据库 看来我应该能够做到这一点,因为它可以通过messenger等与人交谈 我知道这可能是一个三管齐下的方法 想法?@Florentino DeLaguna,在本例中,您可以使用对话服务以及IBM Watson提供的文本到语音和语音到文本API。请参阅可用于此目的的选项: 从理论上讲,您必须构建一个与一个URA集成的应用程序(例如使用星号),将语音转换

我想编写一些代码,我的员工可以打电话进来,沃森会问他们重要的问题,他们可以告诉沃森信息,沃森然后将这些信息输出到CSV、XLS等格式,甚至可能是数据库

看来我应该能够做到这一点,因为它可以通过messenger等与人交谈

我知道这可能是一个三管齐下的方法


想法?

@Florentino DeLaguna,在本例中,您可以使用对话服务以及IBM Watson提供的文本到语音和语音到文本API。请参阅可用于此目的的选项:

  • 从理论上讲,您必须构建一个与一个URA集成的应用程序(例如使用星号),将语音转换为文本,将文本发送给对话服务,并将对话的
    响应
    转换为语音并发送给
    URA
    。在实践中,存在一些会话问题,尤其是从言语到语篇。但是,您可以使用IBM Watson文本到语音的使用一些效果(更快和更慢的声音,控制暂停,放置情绪…) Obs:URA音频是窄带的,
    8khz
    ,大多数语音到文本服务只接受宽带,
    16khz

    Obs II:您的应用程序(如Asterisk)需要能够使用RESTAPI和/或使用Web套接字,然后才能调用Watson语音到文本服务

  • 另一种选择是将呼叫从Asterisk路由到新的IBM Voice Gateway,该网关是一个SIP端点,通过编排语音到文本、文本到语音和Watson对话服务,面向Watson自助服务代理。您可以将IBM语音网关看作是一个独立的认知IVR系统。到这里来更多

  • 另一个可能的选择是使用
    MRCP
    。IBM有一个服务解决方案,允许您使用MRCP访问Watson STT和TTS引擎。不确定Asterisk是否支持MRCP,但这通常是传统IVR与ASR集成的方式

  • 重要:选项2和3由另一个人回答,请参见官方

    查看有关这些API的更多信息:


    @Florentino DeLaguna,在这种情况下,您可以使用IBM Watson提供的对话服务、文本到语音和语音到文本API。请参阅可用于此目的的选项:

  • 从理论上讲,您必须构建一个与一个URA集成的应用程序(例如使用星号),将语音转换为文本,将文本发送给对话服务,并将对话的
    响应
    转换为语音并发送给
    URA
    。在实践中,存在一些会话问题,尤其是从言语到语篇。但是,您可以使用IBM Watson文本到语音的使用一些效果(更快和更慢的声音,控制暂停,放置情绪…) Obs:URA音频是窄带的,
    8khz
    ,大多数语音到文本服务只接受宽带,
    16khz

    Obs II:您的应用程序(如Asterisk)需要能够使用RESTAPI和/或使用Web套接字,然后才能调用Watson语音到文本服务

  • 另一种选择是将呼叫从Asterisk路由到新的IBM Voice Gateway,该网关是一个SIP端点,通过编排语音到文本、文本到语音和Watson对话服务,面向Watson自助服务代理。您可以将IBM语音网关看作是一个独立的认知IVR系统。到这里来更多

  • 另一个可能的选择是使用
    MRCP
    。IBM有一个服务解决方案,允许您使用MRCP访问Watson STT和TTS引擎。不确定Asterisk是否支持MRCP,但这通常是传统IVR与ASR集成的方式

  • 重要:选项2和3由另一个人回答,请参见官方

    查看有关这些API的更多信息:


    看看Voximal解决方案,它将所有SpeechToText Cloud API(和TextToSpeech)集成为一个星号应用程序和一个VoiceXML标准浏览器

    所有这些都集成在VoiceXML解释器中,您可以获得转录的全文结果,您可以将其推送到聊天机器人,以检测用户的意图,并选择日期、数字、城市等动态参数。。。例如,使用api.ai

    Voximal支持来自谷歌、微软、IBM/watson(很快还有亚马逊)的STT


    Sayuri列出的3个API嵌入到解决方案中。

    看看Voximal解决方案,它将所有SpeechToText Cloud API(和TextToSpeech)集成为一个星号应用程序和一个VoiceXML标准浏览器

    所有这些都集成在VoiceXML解释器中,您可以获得转录的全文结果,您可以将其推送到聊天机器人,以检测用户的意图,并选择日期、数字、城市等动态参数。。。例如,使用api.ai

    Voximal支持来自谷歌、微软、IBM/watson(很快还有亚马逊)的STT

    Sayuri列出的3个API嵌入到解决方案中