Mobile 补偿通道效应

Mobile 补偿通道效应,mobile,signal-processing,Mobile,Signal Processing,我正试图在一个系统上工作,在这个系统中,录音句子的质量是由计算机评定的。该系统有三种运行模式: 当该人使用麦克风和混音器录制句子时。 当用户通过固定电话记录时。 当用户通过手机记录时。 我注意到,我从使用上述三种来源的录音中获得的分数按以下顺序排列:麦克风分数>固定电话分数>移动电话分数 上述顺序很可能是由于编解码器和信道特性的影响。我的问题是: 可以做些什么来补偿通道/编解码器引入的伪影,以获得跨通道的一致分数?如果是某种反向过滤,那么请提供一些我可以开始的链接。 如何检测输入语音记录在哪个频

我正试图在一个系统上工作,在这个系统中,录音句子的质量是由计算机评定的。该系统有三种运行模式:

当该人使用麦克风和混音器录制句子时。 当用户通过固定电话记录时。 当用户通过手机记录时。 我注意到,我从使用上述三种来源的录音中获得的分数按以下顺序排列:麦克风分数>固定电话分数>移动电话分数

上述顺序很可能是由于编解码器和信道特性的影响。我的问题是:

可以做些什么来补偿通道/编解码器引入的伪影,以获得跨通道的一致分数?如果是某种反向过滤,那么请提供一些我可以开始的链接。 如何检测输入语音记录在哪个频道?使用HMMs?
编辑1:我无权详细说明标准。我从麦克风、固定电话和手机上得到的同一句话的当前分数,在这三种媒体上说的同样的话,大约是80分、66分、41分。这种差异可能是由于通道效应造成的。如果句子的内容和表达方式是相同的,那么我正在寻找一种算法来规范分数,它们不必相同,但应该相近

很可能是音质不同。 你试过听一些例子吗

您还可以使用任何频谱分析仪详细查看该数据。我建议。你应该注意的事情:噪音地板和演讲之间的距离

另外,请看字母t、f和s说话时的高频噪声爆发。在低质量的行中,这些字母之间的差异消失了


你为什么要歪曲质量标准?对音质做出客观的反应似乎更有意义。

很可能是音质不同。 你试过听一些例子吗

您还可以使用任何频谱分析仪详细查看该数据。我建议。你应该注意的事情:噪音地板和演讲之间的距离

另外,请看字母t、f和s说话时的高频噪声爆发。在低质量的行中,这些字母之间的差异消失了


你为什么要歪曲质量标准?给出客观的质量响应似乎更有意义。

固定电话编解码器将删除4 kHz左右及以上的所有频率。作为有损压缩过程的一部分,手机编解码器将丢弃更多信息。除非您有关于原始音频内容的另一个旁道信息,否则没有可靠的方法来恢复被丢弃的音频


规范化的最佳方法是对音频进行低通滤波,以匹配8 kHz电信编解码器,并通过一些蜂窝标准压缩算法运行结果。可能会有一种针对特定移动蜂窝协议发布的压缩算法。这将使所有3个信号的质量降低到大致相同。

固定电话编解码器将删除4 kHz及以上的所有频率。作为有损压缩过程的一部分,手机编解码器将丢弃更多信息。除非您有关于原始音频内容的另一个旁道信息,否则没有可靠的方法来恢复被丢弃的音频


规范化的最佳方法是对音频进行低通滤波,以匹配8 kHz电信编解码器,并通过一些蜂窝标准压缩算法运行结果。可能会有一种针对特定移动蜂窝协议发布的压缩算法。这会将所有3个信号的质量降低到大致相同的程度。

那么,通过某种反向滤波,你的意思是你想要一种可靠的通用算法,用于从手机上录制录音并进行转换,使其听起来像是使用专业的麦克风和混音器设置录制的?因为这可能很难。在完全不可能的意义上。除此之外,也许你可以澄清评级是如何发生的?什么样的标准?@wrosecrans:我的目标不是实现一个艰难的转型。我正在寻找一些算法来规范我得到的分数。请参阅编辑1,如果您有更多疑问,请告诉我。谢谢你的回复!所以,通过某种反滤波,你的意思是你想要一种可靠的通用算法,用于从手机中获取录音,并对其进行转换,使其听起来像是使用专业的麦克风和混音器设置录制的?因为这可能很难。在完全不可能的意义上。除此之外,也许你可以澄清评级是如何发生的?什么样的标准?@wrosecrans:我的目标不是实现一个艰难的转型。我正在寻找一些算法来规范我得到的分数。请参阅编辑1,并让我知道,如果你有一些
更多查询。谢谢你的回复!是的,我试过听一些例子,它们听起来都很相似。我想改变这些衡量标准,因为我正在尝试开发一个应用程序,它可以根据人们说话方式的质量对人们进行评分。因此,它必须独立于编解码器/频道条件施加的任何影响,才能使分数正常化。是的,我试过听示例,它们听起来都很相似。我想改变这些衡量标准,因为我正在尝试开发一个应用程序,它可以根据人们说话方式的质量对人们进行评分。因此,它必须独立于编解码器/信道条件施加的任何影响,以使分数标准化。