Audio 与说话人语音相关的声波特征
声波的几个最简单的特征与不同说话人的声音之间的差异有什么关系?在哪里可以找到如何从数据计算这些值 我们正在尝试解决的项目需要3小时的音频输入,每一时刻都有两个人中的一个在说话或沉默。我们需要使用hmm确定每一时刻对应于这些备选方案中的哪一个Audio 与说话人语音相关的声波特征,audio,signal-processing,Audio,Signal Processing,声波的几个最简单的特征与不同说话人的声音之间的差异有什么关系?在哪里可以找到如何从数据计算这些值 我们正在尝试解决的项目需要3小时的音频输入,每一时刻都有两个人中的一个在说话或沉默。我们需要使用hmm确定每一时刻对应于这些备选方案中的哪一个 结果不一定要100%准确。一个近似值就足够了。这是一个程序的问题,而不是一个程序要解决的问题吗?我知道有像ALIZE和LIUM这样的库/API可以自动完成这类事情,但我们正在尝试看看我们到底能走多远。解决方案并不重要。重要的是看看我们自己能走多远。这是绝对不
结果不一定要100%准确。一个近似值就足够了。这是一个程序的问题,而不是一个程序要解决的问题吗?我知道有像ALIZE和LIUM这样的库/API可以自动完成这类事情,但我们正在尝试看看我们到底能走多远。解决方案并不重要。重要的是看看我们自己能走多远。这是绝对不可能的吗?任何帮助都将不胜感激。