Mobile 补偿通道效应_Mobile_Signal Processing

Mobile 补偿通道效应

mobile

Mobile 补偿通道效应,mobile,signal-processing,Mobile,Signal Processing,我正试图在一个系统上工作，在这个系统中，录音句子的质量是由计算机评定的。该系统有三种运行模式：当该人使用麦克风和混音器录制句子时。当用户通过固定电话记录时。当用户通过手机记录时。我注意到，我从使用上述三种来源的录音中获得的分数按以下顺序排列：麦克风分数>固定电话分数>移动电话分数上述顺序很可能是由于编解码器和信道特性的影响。我的问题是: 可以做些什么来补偿通道/编解码器引入的伪影，以获得跨通道的一致分数？如果是某种反向过滤，那么请提供一些我可以开始的链接。如何检测输入语音记录在哪个频

我正试图在一个系统上工作，在这个系统中，录音句子的质量是由计算机评定的。该系统有三种运行模式：

当该人使用麦克风和混音器录制句子时。当用户通过固定电话记录时。当用户通过手机记录时。我注意到，我从使用上述三种来源的录音中获得的分数按以下顺序排列：麦克风分数>固定电话分数>移动电话分数

上述顺序很可能是由于编解码器和信道特性的影响。我的问题是:

可以做些什么来补偿通道/编解码器引入的伪影，以获得跨通道的一致分数？如果是某种反向过滤，那么请提供一些我可以开始的链接。如何检测输入语音记录在哪个频道？使用HMMs？

编辑1：我无权详细说明标准。我从麦克风、固定电话和手机上得到的同一句话的当前分数，在这三种媒体上说的同样的话，大约是80分、66分、41分。这种差异可能是由于通道效应造成的。如果句子的内容和表达方式是相同的，那么我正在寻找一种算法来规范分数，它们不必相同，但应该相近

很可能是音质不同。你试过听一些例子吗

您还可以使用任何频谱分析仪详细查看该数据。我建议。你应该注意的事情：噪音地板和演讲之间的距离

另外，请看字母t、f和s说话时的高频噪声爆发。在低质量的行中，这些字母之间的差异消失了

你为什么要歪曲质量标准？对音质做出客观的反应似乎更有意义。

很可能是音质不同。你试过听一些例子吗

您还可以使用任何频谱分析仪详细查看该数据。我建议。你应该注意的事情：噪音地板和演讲之间的距离

另外，请看字母t、f和s说话时的高频噪声爆发。在低质量的行中，这些字母之间的差异消失了

你为什么要歪曲质量标准？给出客观的质量响应似乎更有意义。

固定电话编解码器将删除4 kHz左右及以上的所有频率。作为有损压缩过程的一部分，手机编解码器将丢弃更多信息。除非您有关于原始音频内容的另一个旁道信息，否则没有可靠的方法来恢复被丢弃的音频

规范化的最佳方法是对音频进行低通滤波，以匹配8 kHz电信编解码器，并通过一些蜂窝标准压缩算法运行结果。可能会有一种针对特定移动蜂窝协议发布的压缩算法。这将使所有3个信号的质量降低到大致相同。

固定电话编解码器将删除4 kHz及以上的所有频率。作为有损压缩过程的一部分，手机编解码器将丢弃更多信息。除非您有关于原始音频内容的另一个旁道信息，否则没有可靠的方法来恢复被丢弃的音频

规范化的最佳方法是对音频进行低通滤波，以匹配8 kHz电信编解码器，并通过一些蜂窝标准压缩算法运行结果。可能会有一种针对特定移动蜂窝协议发布的压缩算法。这会将所有3个信号的质量降低到大致相同的程度。

那么，通过某种反向滤波，你的意思是你想要一种可靠的通用算法，用于从手机上录制录音并进行转换，使其听起来像是使用专业的麦克风和混音器设置录制的？因为这可能很难。在完全不可能的意义上。除此之外，也许你可以澄清评级是如何发生的？什么样的标准？@wrosecrans：我的目标不是实现一个艰难的转型。我正在寻找一些算法来规范我得到的分数。请参阅编辑1，如果您有更多疑问，请告诉我。谢谢你的回复！所以，通过某种反滤波，你的意思是你想要一种可靠的通用算法，用于从手机中获取录音，并对其进行转换，使其听起来像是使用专业的麦克风和混音器设置录制的？因为这可能很难。在完全不可能的意义上。除此之外，也许你可以澄清评级是如何发生的？什么样的标准？@wrosecrans：我的目标不是实现一个艰难的转型。我正在寻找一些算法来规范我得到的分数。请参阅编辑1，并让我知道，如果你有一些

更多查询。谢谢你的回复！是的，我试过听一些例子，它们听起来都很相似。我想改变这些衡量标准，因为我正在尝试开发一个应用程序，它可以根据人们说话方式的质量对人们进行评分。因此，它必须独立于编解码器/频道条件施加的任何影响，才能使分数正常化。是的，我试过听示例，它们听起来都很相似。我想改变这些衡量标准，因为我正在尝试开发一个应用程序，它可以根据人们说话方式的质量对人们进行评分。因此，它必须独立于编解码器/信道条件施加的任何影响，以使分数标准化。