Warning: file_get_contents(/data/phpspider/zhask/data//catemap/5/date/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Audio 与说话人语音相关的声波特征_Audio_Signal Processing - Fatal编程技术网

Audio 与说话人语音相关的声波特征

Audio 与说话人语音相关的声波特征,audio,signal-processing,Audio,Signal Processing,声波的几个最简单的特征与不同说话人的声音之间的差异有什么关系?在哪里可以找到如何从数据计算这些值 我们正在尝试解决的项目需要3小时的音频输入,每一时刻都有两个人中的一个在说话或沉默。我们需要使用hmm确定每一时刻对应于这些备选方案中的哪一个 结果不一定要100%准确。一个近似值就足够了。这是一个程序的问题,而不是一个程序要解决的问题吗?我知道有像ALIZE和LIUM这样的库/API可以自动完成这类事情,但我们正在尝试看看我们到底能走多远。解决方案并不重要。重要的是看看我们自己能走多远。这是绝对不

声波的几个最简单的特征与不同说话人的声音之间的差异有什么关系?在哪里可以找到如何从数据计算这些值

我们正在尝试解决的项目需要3小时的音频输入,每一时刻都有两个人中的一个在说话或沉默。我们需要使用hmm确定每一时刻对应于这些备选方案中的哪一个


结果不一定要100%准确。一个近似值就足够了。

这是一个程序的问题,而不是一个程序要解决的问题吗?我知道有像ALIZE和LIUM这样的库/API可以自动完成这类事情,但我们正在尝试看看我们到底能走多远。解决方案并不重要。重要的是看看我们自己能走多远。这是绝对不可能的吗?任何帮助都将不胜感激。