Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/iphone/41.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Iphone 如何比较iOS上的两个语音样本?_Iphone_Ios_Signal Processing_Voice Recognition - Fatal编程技术网

Iphone 如何比较iOS上的两个语音样本?

Iphone 如何比较iOS上的两个语音样本?,iphone,ios,signal-processing,voice-recognition,Iphone,Ios,Signal Processing,Voice Recognition,首先,我想说的是,我的问题不是关于语音识别的“经典”定义 从以下意义上讲,我们试图做的有些不同: 用户记录他的命令 稍后,当用户说出预先录制的命令时,将发生特定的操作 例如,我录制了一个呼叫我妈妈的语音命令,所以我点击她并说“妈妈”。 然后当我用这个程序说“妈妈”时,它会自动给她打电话 如何将语音命令与保存的语音样本进行比较 编辑: 我们不需要任何“文本到语音”的能力,只需要比较声音信号。 显然,我们正在寻找某种现成的产品或框架。尝试使用第三方库,如iOS应用程序。您可以让用户录制语音样本并将其

首先,我想说的是,我的问题不是关于语音识别的“经典”定义

从以下意义上讲,我们试图做的有些不同:

  • 用户记录他的命令
  • 稍后,当用户说出预先录制的命令时,将发生特定的操作
  • 例如,我录制了一个呼叫我妈妈的语音命令,所以我点击她并说“妈妈”。 然后当我用这个程序说“妈妈”时,它会自动给她打电话

    如何将语音命令与保存的语音样本进行比较

    编辑: 我们不需要任何“文本到语音”的能力,只需要比较声音信号。
    显然,我们正在寻找某种现成的产品或框架。

    尝试使用第三方库,如iOS应用程序。您可以让用户录制语音样本并将其保存为翻译文本,或者让他们输入文本进行识别。

    我认为您必须执行某种操作来确定这两个信号的相似性。(当然,假设是同一个用户)。我只是把这个答案打出来看看是否有帮助,但我还是会等待其他人给出更好的答案。我的信号处理技能几乎为零

    我不确定你的问题是关于DSP还是如何在iPhone上实现DSP。如果是后者,我将从苹果提供的Speak Here项目开始。这样,您就已经有了将语音录制到文件中的接口。这会给你省去很多麻烦

    音乐识别的一种方法是为所讨论的两种声音获取频谱的时间序列(时间窗STFT FFT),在时间轴上映射频率峰值的位置,并将两个2D时频峰值映射相互关联以进行匹配。这比仅仅对两个声音样本进行互相关要稳健得多,因为峰值的变化远小于光谱峰值之间的所有光谱“积垢”。如果两次说话的频率和音调没有太大的变化,这种方法会工作得更好


    在iOS 4.x中,您可以对FFT使用加速框架,也可以使用2D互相关。

    正如我所说,如何实现我的要求:)为了解决这个问题,我们不需要任何类型的“文本到语音”或任何类型的内容,我们正在寻找一个相对简单的框架,可以比较两个声音信号,看看它们是否“相同”。这样,即使是非英语国家的人也可以使用这个程序。你找到这个问题的有效答案了吗?我甚至不需要将所说的语音命令翻译成文本,我只想存储所说的命令,然后进行比较。不,你真的需要语音识别。比较“相等”的声音并没有考虑第二个录制的样本与第一个不同的许多方式中的任何一种。汽车在后台经过?用户在单词之间暂停的时间稍微长一些?还是口吃?原谅你的用户——他们是人,不能两次发出完全相同的声音。互相关似乎是我们项目所需要的,因为我们希望它是通用的(而不仅仅是英语客户)