Speech recognition 尖叫声检测

Speech recognition 尖叫声检测,speech-recognition,similarity,audio-fingerprinting,Speech Recognition,Similarity,Audio Fingerprinting,我正在做一个项目,需要检测一些声音模式。 例如“有人在尖叫”:因为我不知道那个人是谁,一个孩子,男人,女人。。。每个人都有自己的声音。。。等等 因此,我正在寻找一种检测“尖叫”的方法,例如,保存尽可能多的“尖叫”指纹,然后当我需要检查一个声音是否是“尖叫”声音时,我可以为它创建一个指纹,然后搜索,看看我是否能在我已有的“尖叫”指纹列表中找到相似之处 我的方法是使用以下项目: 每个人都会给我一个特定声音的独特指纹,对吗?, 我的问题是: 我如何才能在“尖叫”指纹列表中搜索相似性,是否有任何

我正在做一个项目,需要检测一些声音模式。 例如“有人在尖叫”:因为我不知道那个人是谁,一个孩子,男人,女人。。。每个人都有自己的声音。。。等等

因此,我正在寻找一种检测“尖叫”的方法,例如,保存尽可能多的“尖叫”指纹,然后当我需要检查一个声音是否是“尖叫”声音时,我可以为它创建一个指纹,然后搜索,看看我是否能在我已有的“尖叫”指纹列表中找到相似之处

我的方法是使用以下项目:

每个人都会给我一个特定声音的独特指纹,对吗?, 我的问题是: 我如何才能在“尖叫”指纹列表中搜索相似性,是否有任何可能的方法生成分数或返回每个指纹的%相似性,以便我可以确定我测试的声音是%还是尖叫

谢谢, J.B

我的方法是使用以下项目:

不是很好的主意,尖叫声通常是相当稳定的声音,而所有这些库搜索声音中的不规则性。他们不会发现任何东西。最好使用简单的DNN-LSTM分类器。您可以使用tensorflow或任何其他DNN框架对其进行训练。你可以在这里找到算法的描述

或在此:

我如何才能在“尖叫”指纹列表中搜索相似性,是否有任何可能的方法生成分数或返回每个指纹的%相似性,以便我可以确定我测试的声音是%还是尖叫

在第一个库中,您可以使用queryResult.BestMatch.Confidence,例如:

置信度-返回介于[0,1]之间的值。低于0.15的值很可能是假阳性。大于0.15的值很可能是完全匹配的。对于良好的音频质量查询,您可以期望获得大于0.5的置信度

我的方法是使用以下项目:

不是很好的主意,尖叫声通常是相当稳定的声音,而所有这些库搜索声音中的不规则性。他们不会发现任何东西。最好使用简单的DNN-LSTM分类器。您可以使用tensorflow或任何其他DNN框架对其进行训练。你可以在这里找到算法的描述

或在此:

我如何才能在“尖叫”指纹列表中搜索相似性,是否有任何可能的方法生成分数或返回每个指纹的%相似性,以便我可以确定我测试的声音是%还是尖叫

在第一个库中,您可以使用queryResult.BestMatch.Confidence,例如:

置信度-返回介于[0,1]之间的值。低于0.15的值很可能是假阳性。大于0.15的值很可能是完全匹配的。对于良好的音频质量查询,您可以期望获得大于0.5的置信度


谢谢,与tensorflow合作,我的感觉(和一些预先计算)在缩放时会花费我们很多!!谢谢,与tensorflow合作,我的感觉(和一些预先计算)在缩放时会花费我们很多!!