Audio 音频性别检测

Audio 音频性别检测,audio,analysis,Audio,Analysis,我一直在到处寻找某种形式的性别检测,通过读取音频文件的频率数据。我还没找到一个能做到这一点的程序,或者任何能输出音频数据的程序,这样我就可以编写一个基本的程序来读取并操纵它来确定说话人的性别 你们中有谁知道我在哪里可以找到帮助我的东西吗 重申一下,我基本上希望有一个程序,当一个人对着麦克风说话时,它会准确地说出说话者的性别。我的全部计划是在上面也有语音对文本的功能,所以这个程序将写出演讲者所说的话,并给出演讲者的一些非常基本的人口统计数据 *最好使用支持跨平台或linux的通用脚本语言。您需要研

我一直在到处寻找某种形式的性别检测,通过读取音频文件的频率数据。我还没找到一个能做到这一点的程序,或者任何能输出音频数据的程序,这样我就可以编写一个基本的程序来读取并操纵它来确定说话人的性别

你们中有谁知道我在哪里可以找到帮助我的东西吗

重申一下,我基本上希望有一个程序,当一个人对着麦克风说话时,它会准确地说出说话者的性别。我的全部计划是在上面也有语音对文本的功能,所以这个程序将写出演讲者所说的话,并给出演讲者的一些非常基本的人口统计数据


*最好使用支持跨平台或linux的通用脚本语言。

您需要研究共振峰检测和线性预测编码。它有一些可以移植到scipy/numpy的信号流图

虽然这是一个老问题,但如果有人对从音频中进行性别检测感兴趣,您可以通过提取MFCC(Mel频率倒谱系数)特征并使用机器学习模型GMM(高斯混合模型)对其建模来轻松实现这一点

我们可以学习本教程,它实现了同样的功能,并对从谷歌AudioSet性别数据中提取的子集进行了评估

可能重复:可能重复