Speech recognition 尖叫声检测_Speech Recognition_Similarity_Audio Fingerprinting

Speech recognition 尖叫声检测

speech-recognition

Speech recognition 尖叫声检测,speech-recognition,similarity,audio-fingerprinting,Speech Recognition,Similarity,Audio Fingerprinting,我正在做一个项目，需要检测一些声音模式。例如“有人在尖叫”：因为我不知道那个人是谁，一个孩子，男人，女人。。。每个人都有自己的声音。。。等等因此，我正在寻找一种检测“尖叫”的方法，例如，保存尽可能多的“尖叫”指纹，然后当我需要检查一个声音是否是“尖叫”声音时，我可以为它创建一个指纹，然后搜索，看看我是否能在我已有的“尖叫”指纹列表中找到相似之处我的方法是使用以下项目：每个人都会给我一个特定声音的独特指纹，对吗？，我的问题是: 我如何才能在“尖叫”指纹列表中搜索相似性，是否有任何

我正在做一个项目，需要检测一些声音模式。例如“有人在尖叫”：因为我不知道那个人是谁，一个孩子，男人，女人。。。每个人都有自己的声音。。。等等

因此，我正在寻找一种检测“尖叫”的方法，例如，保存尽可能多的“尖叫”指纹，然后当我需要检查一个声音是否是“尖叫”声音时，我可以为它创建一个指纹，然后搜索，看看我是否能在我已有的“尖叫”指纹列表中找到相似之处

我的方法是使用以下项目：

每个人都会给我一个特定声音的独特指纹，对吗？，我的问题是: 我如何才能在“尖叫”指纹列表中搜索相似性，是否有任何可能的方法生成分数或返回每个指纹的%相似性，以便我可以确定我测试的声音是%还是尖叫

谢谢， J.B

我的方法是使用以下项目：

不是很好的主意，尖叫声通常是相当稳定的声音，而所有这些库搜索声音中的不规则性。他们不会发现任何东西。最好使用简单的DNN-LSTM分类器。您可以使用tensorflow或任何其他DNN框架对其进行训练。你可以在这里找到算法的描述

或在此：

我如何才能在“尖叫”指纹列表中搜索相似性，是否有任何可能的方法生成分数或返回每个指纹的%相似性，以便我可以确定我测试的声音是%还是尖叫

在第一个库中，您可以使用queryResult.BestMatch.Confidence，例如：

置信度-返回介于[0,1]之间的值。低于0.15的值很可能是假阳性。大于0.15的值很可能是完全匹配的。对于良好的音频质量查询，您可以期望获得大于0.5的置信度

我的方法是使用以下项目：

或在此：

我如何才能在“尖叫”指纹列表中搜索相似性，是否有任何可能的方法生成分数或返回每个指纹的%相似性，以便我可以确定我测试的声音是%还是尖叫

在第一个库中，您可以使用queryResult.BestMatch.Confidence，例如：

谢谢，与tensorflow合作，我的感觉（和一些预先计算）在缩放时会花费我们很多！！谢谢，与tensorflow合作，我的感觉（和一些预先计算）在缩放时会花费我们很多！！