Audio 承认;“叮咚”;声音

Audio 承认;“叮咚”;声音,audio,machine-learning,pattern-recognition,audio-processing,Audio,Machine Learning,Pattern Recognition,Audio Processing,我正在建立声音识别模型来检测“叮咚”的声音 有两个程序,培训和测试 训练数据是由设备产生的“叮咚”声 该模型能够检测到同一设备产生的“叮咚”声,效果良好 但是,当第二台设备发出新的“叮咚”声时,性能会很差 我知道这个问题的可能解决方案:录制第二台设备产生的“叮咚”声,并将其添加到训练数据中 但是,总有一种新的装置,新的“叮咚”声 我该怎么办?您正面临过度安装的问题。过度拟合意味着您的模型经过训练,能够在训练数据集的特定情况下以最佳方式工作。为了克服这个问题,您应该在许多设备上训练您的模型,然后在

我正在建立声音识别模型来检测“叮咚”的声音

有两个程序,培训和测试

训练数据是由设备产生的“叮咚”声

该模型能够检测到同一设备产生的“叮咚”声,效果良好

但是,当第二台设备发出新的“叮咚”声时,性能会很差

我知道这个问题的可能解决方案:录制第二台设备产生的“叮咚”声,并将其添加到训练数据中

但是,总有一种新的装置,新的“叮咚”声


我该怎么办?

您正面临过度安装的问题。过度拟合意味着您的模型经过训练,能够在训练数据集的特定情况下以最佳方式工作。为了克服这个问题,您应该在许多设备上训练您的模型,然后在它们之间进行插值。您使用的模型可以保证插值

然而,前面的信息是如此笼统。在您的情况下,您可能会找到更简单的方法。一切都取决于你如何定义“叮咚”。如果你能为“叮咚”找到一个标志,那就太好了。此签名应该对所有不需要的特征保持不变

例如,“Diiiying Dooooong”应该被接受吗?如果是,您应该找到一个签名,该签名与音频剪辑的长度不变性。频率更高的“叮咚”是否可以接受?如果是,你应该找到一个签名,它将频率作为彼此的分数而不是绝对值,以此类推

顺便说一句,我相信你可以在谷歌上找到很多关于你的问题的文章,但可能是关于“当当”而不是“叮当”,但你仍然可以从中受益;)

所以你想从“其他声音”中识别“叮咚声”

一种方法是训练数据,将“其他声音”识别为其他类别。因此,一个新的叮咚可能比“其他声音”更容易与“叮咚声音”联系起来

这种方法的一个缺点可能是“假警报”的数量增加,但这项任务总是导致精度和召回率之间的折衷