Speech recognition 语音识别桌面技术

Speech recognition 语音识别桌面技术,speech-recognition,Speech Recognition,我不确定Stackoverflow是个合适的地方。如果不是的话,请带我到正确的地方 我想做一个脚本,可以运行和听我的声音,并识别我说的话 它会有一些精确的命令,比如“播放我的音乐”等等 在我看来,我在这个项目中将有3个不同的部分: 听和写声音文件的人 另一个用于将声音文件转换为文本的 最后一个将文本与命令进行比较(如果它可以匹配“播放我的音乐”和“播放一些音乐”就更好了) 我做了一些研究,但有点超出我的理解。可能是我的出发点,但已经3年了 我想从那以后会有很多新技术问世,我想听听你们对它的了解

我不确定Stackoverflow是个合适的地方。如果不是的话,请带我到正确的地方

我想做一个脚本,可以运行和听我的声音,并识别我说的话

它会有一些精确的命令,比如“播放我的音乐”等等

在我看来,我在这个项目中将有3个不同的部分:

  • 听和写声音文件的人
  • 另一个用于将声音文件转换为文本的
  • 最后一个将文本与命令进行比较(如果它可以匹配“播放我的音乐”和“播放一些音乐”就更好了)
  • 我做了一些研究,但有点超出我的理解。可能是我的出发点,但已经3年了

    我想从那以后会有很多新技术问世,我想听听你们对它的了解

    关于技术,我愿意使用任何必要的,但不是.NET,我希望避免使用JAVA。性能不是问题,我更喜欢简单而不是性能。 我正在Mac上工作,我希望它也能在Mac和linux环境下运行

    我将把它放在Github的公共存储库中,所以任何昂贵的解决方案都不可能(只是说)。

    下面是一个使用google语音api执行步骤1和步骤2的解决方案

    它是用clojure编写的,clojure是一种驻留在jvm上的类似lisp的语言。
    整个项目很简单,请查看。

    使用谷歌语音api是一个开始!我第一次听说这种语言!