基于librosa和Python的音频文件特征提取
我想通过机器学习(分类和聚类)和相关、相似性计算来处理声音(语音)文件。出于所有这些目的,我需要像往常一样应用某种特征提取。我选择了librosa图书馆的MFCC:基于librosa和Python的音频文件特征提取,python,machine-learning,voice,speech,librosa,Python,Machine Learning,Voice,Speech,Librosa,我想通过机器学习(分类和聚类)和相关、相似性计算来处理声音(语音)文件。出于所有这些目的,我需要像往常一样应用某种特征提取。我选择了librosa图书馆的MFCC: import librosa y, sr = librosa.core.load(filename) m = librosa.feature.mfcc(y=y, sr=sr) 现在,将m作为附加功能,我面临多个问题: 与我的期望相反,MFCC返回的是2D数组,而不是通常需要的一维数组 上述分析方法。我应该坚持这种方法,并尝试以某
import librosa
y, sr = librosa.core.load(filename)
m = librosa.feature.mfcc(y=y, sr=sr)
现在,将m
作为附加功能,我面临多个问题: