Audio 使用OpenSMILE从实时输入中提取音频特征

Audio 使用OpenSMILE从实时输入中提取音频特征,audio,feature-extraction,Audio,Feature Extraction,我可以使用OpenSMILE从存储在系统中的音频文件中提取功能。但我需要使用相同的OpenSMILE实时提取特征。是否可以不保存录制的音频文件?它似乎支持此功能。从 检查您的SMILExtract二进制文件是否支持实时音频录制和 播放,键入: SMILExtract-H cPortaudio 及 组件cPortaudioSource和cPortaudioSink可以用作 替换cWaveSource和cWaveSink。他们产生/期望数据 与波浪分量的格式相同 互联网搜索万岁…如果您使用portA

我可以使用OpenSMILE从存储在系统中的音频文件中提取功能。但我需要使用相同的OpenSMILE实时提取特征。是否可以不保存录制的音频文件?

它似乎支持此功能。从

检查您的SMILExtract二进制文件是否支持实时音频录制和 播放,键入:
SMILExtract-H cPortaudio

组件cPortaudioSource和cPortaudioSink可以用作 替换cWaveSource和cWaveSink。他们产生/期望数据 与波浪分量的格式相同


互联网搜索万岁…

如果您使用portAudio构建openSMILE,它将正常工作:)

根据手册:

。。。提供了一个实时特征提取示例,其中 捕获实时音频并从输入中提取韵律特征(音调和响度轮廓)。 这些功能将保存到CSV文件中。要使用此配置,请键入:


SMILExtract-您可能还需要一个cTurnDetector组件(请参阅中引用的SIG'MM教程)和一个VAD,以便对某些功能(函数)的实时输入进行分段

还要查看:了解如何自定义配置文件并正确设置缓冲区大小(在实时模式下,使用环形缓冲区以避免内存消耗增加很重要)