Algorithm 确定最佳音频质量

Algorithm 确定最佳音频质量,algorithm,audio,signal-processing,Algorithm,Audio,Signal Processing,如何在不查看音频文件头的情况下,确定同一音频剪辑的音频文件列表中的最佳音频质量。棘手的是,所有的文件都来自不同的格式和比特率,它们都使用相同的格式和比特率。如何有效地做到这一点 如果我理解正确的话,您有一堆音频文件,它们以不同的格式开始,质量也不同。它们都已转换为相同的格式,因此您无法使用标题来确定哪些是原始高质量的,哪些不是 这是一个难题。可能有一些技巧可以解决一些质量问题,但检测(比如)从低比特率压缩算法(如MP3)转换而来的内容将非常困难 一些简单的技巧: 检查最大振幅-如果它低,质量将

如何在不查看音频文件头的情况下,确定同一音频剪辑的音频文件列表中的最佳音频质量。棘手的是,所有的文件都来自不同的格式和比特率,它们都使用相同的格式和比特率。如何有效地做到这一点

如果我理解正确的话,您有一堆音频文件,它们以不同的格式开始,质量也不同。它们都已转换为相同的格式,因此您无法使用标题来确定哪些是原始高质量的,哪些不是

这是一个难题。可能有一些技巧可以解决一些质量问题,但检测(比如)从低比特率压缩算法(如MP3)转换而来的内容将非常困难

一些简单的技巧:

  • 检查最大振幅-如果它低,质量将不好
  • 测量最高频率-如果频率较低,则原始的采样率可能较低

如果你有原始的,你可以通过估计传递函数来估计它是如何被改变的。您将需要假设一些模型,可能从低通滤波器开始,添加一些模糊(卷积),然后运行估计器以产生质量度量。你可以看看维基百科上的文章

我认为disown的答案是好的,假设你只是试图估计一组参数。不幸的是,您还必须为估计的参数定义一个比较函数

如果两次压缩都应用了同样大的频率范围,但其中一次允许的频率高于另一次,会发生什么情况。其中一个更好吗?哪一个

答案可能取决于您使用的文件中使用的频率更多


一个客观的衡量标准是看哪个文件丢失的更少。不幸的是,正确地做到这一点并不容易。

我不是一名软件开发人员(我是一名音频工程师),当您使用mp3算法进行压缩时,您会听到: -低高频:因此你可以检查更高范围的能量损失 -失真立体声:所以你可以制作一个中间/侧面矩阵,并检查侧面的THD -更少的相位相干性:也许你可以用相关仪检查一下


希望对你有所帮助,这对电脑来说是一项艰巨的任务

我对此不太确定,但这里有一个好的开始:

我不认为你可以从一个信号中计算出信噪比,但是如果你有一组信号,那么你可以通过比较所有信号来计算出信噪比

页面底部有一些有趣的链接,如果不可能的话,也可以提供一些感兴趣的路线


另外,我不是一名音频工程师,但我对信号处理有一点了解,有什么方法可以测量音频信号中的量化水平吗?也许需要研究一下。

这里列出的许多答案都涉及常见的音频测量,如THD+N、SNR等。然而,这些并不总是与人类对音频伪影的听觉有很好的相关性。有损音频压缩技术通常通过增加THD+N和SNR发挥作用,但其目标是以人耳难以检测的方式实现。一种更传统的音频测量技术可能会发现某个频带的信噪比降低,但如果相邻频带的能量太大,以至于没有人会注意到这种差异,这是否重要

这篇题为“”的研究论文概述了一种算法,用于量化人耳检测可听差异的能力,该算法基于耳朵如何听到的模型。它考虑了与人类感知的音频质量相关的因素。本文包括一项研究,将他们的算法结果与主观双盲测试进行比较,让您了解他们的模型工作得有多好

我找不到这篇论文的免费副本,但一个像样的大学图书馆应该把它存档

实现该算法需要一些频域音频信号处理的知识。有DSP经验的本科生应该能够实现它。如果您没有参考波形,您可以使用本文中的信息来量化不良伪影的程度


该算法适用于PCM音频,最好是时间对齐的,当然不需要知道文件类型或头。

首先,我不是音频工程师,但我一直在努力就音频压缩问题保持联系,因为我有大量的mp3收藏,我有一些想法要分享

从人的角度来看,你想要的是最好的音质吗?如果是这样的话,你就不能用“客观的方法”来测量,比如比较spectrograms等等

如果spectrogram很难看,它不一定意味着质量很差。重要的是,如果有人能够通过盲测试区分编码文件和原始源。时期如果你想检查编码音轨的质量,你必须进行

LAME(和所有其他类型的有损 MP3,AAC,AC3,DTS,ATRAC。。。 压缩机)是所谓的感性的 编码员。它利用了某些有关的事实 人类听觉感知的本质。 所以,你不能仅仅依靠 使用光谱图来评估其质量

现在,如果您的目标是从客观方式/角度出发,您可以使用,它代表音频质量评估:

这是一个客观的衡量标准 用于测量质量的技术 编码/解码音频文件的数量(非常 与峰值相似)

(……)

但是,当使用 客观测试方法包括 仍然没有定论,而且大多只是 由编解码器开发人员和 研究人员

…或

(…)性能