Deep learning 测量音频质量和吸引力/美感

Deep learning 测量音频质量和吸引力/美感,deep-learning,signal-processing,audio-processing,Deep Learning,Signal Processing,Audio Processing,有没有办法衡量音频剪辑的质量和吸引力/美感?质量量化了声音的质量,即噪音越低,质量越好。然而,吸引力/美学衡量声音对人类的吸引力。存在一些图像质量和美学评估方面的工作,例如,但不包括声音/音频方面的工作。任何方法或参考都会有帮助。音频质量或哮喘的测量是在有或没有机器学习的情况下进行的。 然而,大部分的工作集中在语音再现上,更不用说一般的音频了 一个人可以进行听力测试,由一组人类教授听音频并给出分数, 建立平均意见分数(MOS)。 执行这些操作有几个标准,例如。 这些主观分数构成了开发“客观指标”

有没有办法衡量音频剪辑的质量吸引力/美感?质量量化了声音的质量,即噪音越低,质量越好。然而,吸引力/美学衡量声音对人类的吸引力。存在一些图像质量和美学评估方面的工作,例如,但不包括声音/音频方面的工作。任何方法或参考都会有帮助。

音频质量或哮喘的测量是在有或没有机器学习的情况下进行的。 然而,大部分的工作集中在语音再现上,更不用说一般的音频了

一个人可以进行听力测试,由一组人类教授听音频并给出分数, 建立平均意见分数(MOS)。 执行这些操作有几个标准,例如。 这些主观分数构成了开发“客观指标”的基础,这是评估音频质量的算法方法。 早期的一些例子是关于语音质量(2001年以来的ITU标准) 和音频质量(1998年以来的ITU标准)。 更高级的包括(2011年以来的ITU标准)和(在研究中提出)

过去几年的几篇论文表明,人们可以使用深度神经网络学习这些度量。 关于语音质量,最近的一篇论文(2019年)是


我发现对一般音频质量或音乐质量的唯一学习评估是。

音频质量或哮喘的测量是在有和没有机器学习的情况下进行的。 然而,大部分的工作集中在语音再现上,更不用说一般的音频了

一个人可以进行听力测试,由一组人类教授听音频并给出分数, 建立平均意见分数(MOS)。 执行这些操作有几个标准,例如。 这些主观分数构成了开发“客观指标”的基础,这是评估音频质量的算法方法。 早期的一些例子是关于语音质量(2001年以来的ITU标准) 和音频质量(1998年以来的ITU标准)。 更高级的包括(2011年以来的ITU标准)和(在研究中提出)

过去几年的几篇论文表明,人们可以使用深度神经网络学习这些度量。 关于语音质量,最近的一篇论文(2019年)是


我发现,对一般音频质量或音乐质量的唯一学习评估是。

吸引力必然与人的当前情绪联系在一起,因此,只有在对人进行评估之后,才能衡量给定剪辑的任何指标。。。如果这是可能的,那么结果指标将只对该倾听的时间点有效,而在其他时间和任何时候对其他人都是无效的。上诉必然与该人当前的情绪联系在一起,因此,只有在评估该人之后,才能测量给定剪辑的任何指标。。。如果这是可能的,那么结果指标将只在倾听的时间点有效,而在其他时间和任何时候对其他人都是无效的