Audio 承认；“叮咚”；声音_Audio_Machine Learning_Pattern Recognition_Audio Processing

Audio 承认；“叮咚”；声音

audio machine-learning

Audio 承认；“叮咚”；声音,audio,machine-learning,pattern-recognition,audio-processing,Audio,Machine Learning,Pattern Recognition,Audio Processing,我正在建立声音识别模型来检测“叮咚”的声音有两个程序，培训和测试训练数据是由设备产生的“叮咚”声该模型能够检测到同一设备产生的“叮咚”声，效果良好但是，当第二台设备发出新的“叮咚”声时，性能会很差我知道这个问题的可能解决方案：录制第二台设备产生的“叮咚”声，并将其添加到训练数据中但是，总有一种新的装置，新的“叮咚”声我该怎么办？您正面临过度安装的问题。过度拟合意味着您的模型经过训练，能够在训练数据集的特定情况下以最佳方式工作。为了克服这个问题，您应该在许多设备上训练您的模型，然后在

我正在建立声音识别模型来检测“叮咚”的声音

有两个程序，培训和测试

训练数据是由设备产生的“叮咚”声

该模型能够检测到同一设备产生的“叮咚”声，效果良好

但是，当第二台设备发出新的“叮咚”声时，性能会很差

我知道这个问题的可能解决方案：录制第二台设备产生的“叮咚”声，并将其添加到训练数据中

但是，总有一种新的装置，新的“叮咚”声

我该怎么办？

您正面临过度安装的问题。过度拟合意味着您的模型经过训练，能够在训练数据集的特定情况下以最佳方式工作。为了克服这个问题，您应该在许多设备上训练您的模型，然后在它们之间进行插值。您使用的模型可以保证插值

然而，前面的信息是如此笼统。在您的情况下，您可能会找到更简单的方法。一切都取决于你如何定义“叮咚”。如果你能为“叮咚”找到一个标志，那就太好了。此签名应该对所有不需要的特征保持不变

例如，“Diiiying Dooooong”应该被接受吗？如果是，您应该找到一个签名，该签名与音频剪辑的长度不变性。频率更高的“叮咚”是否可以接受？如果是，你应该找到一个签名，它将频率作为彼此的分数而不是绝对值，以此类推

顺便说一句，我相信你可以在谷歌上找到很多关于你的问题的文章，但可能是关于“当当”而不是“叮当”，但你仍然可以从中受益；）

所以你想从“其他声音”中识别“叮咚声”

一种方法是训练数据，将“其他声音”识别为其他类别。因此，一个新的叮咚可能比“其他声音”更容易与“叮咚声音”联系起来

这种方法的一个缺点可能是“假警报”的数量增加，但这项任务总是导致精度和召回率之间的折衷