Machine learning 用机器学习算法训练MFCC

Machine learning 用机器学习算法训练MFCC,machine-learning,scikit-learn,binary-tree,classification,mfcc,Machine Learning,Scikit Learn,Binary Tree,Classification,Mfcc,我有一个数据集的MFCC,我知道是好的。我知道如何将行向量放入机器学习算法中。我的问题是如何使用MFCC,因为它是一个矩阵?例如,我如何将其放入机器学习算法中: 任何算法都可以。我正在研究一个二进制分类器,但将进一步研究它。Scikit似乎是一个很好的资源。现在我只想知道如何将MFCC输入到算法中。一步一步对我帮助很大!我找了很多地方,但没有找到答案 谢谢你在python中,你可以轻松地将矩阵展平,使其成为向量,例如,你可以使用numpy和numpy的展平函数,另外我想到的一个想法(这只是一个

我有一个数据集的MFCC,我知道是好的。我知道如何将行向量放入机器学习算法中。我的问题是如何使用MFCC,因为它是一个矩阵?例如,我如何将其放入机器学习算法中:

任何算法都可以。我正在研究一个二进制分类器,但将进一步研究它。Scikit似乎是一个很好的资源。现在我只想知道如何将MFCC输入到算法中。一步一步对我帮助很大!我找了很多地方,但没有找到答案


谢谢你

在python中,你可以轻松地将矩阵展平,使其成为向量,例如,你可以使用numpy和numpy的展平函数,另外我想到的一个想法(这只是一个想法可能行得通,也可能行不通)是使用卷积,卷积在2d结构中非常有效

在python中,您可以轻松地展平矩阵,使其成为向量,例如,您可以使用numpy和numpy的展平函数,此外,我想到的一个想法(这只是一个想法可能有效,也可能无效)是使用卷积,卷积在2d结构中非常有效

那你想做什么呢?将声音文件A作为特征传递,B作为类传递?为了清晰起见,我重新表述了我的问题。现在的问题包括一个链接。我的数据集看起来就是这样,我想知道如何将其输入到机器学习算法中?为什么这些数字之间有一条空线?有分类目标类吗?解释每个块代表一个声音文件的数据。每一行是此类声音文件(20-40ms)的一小部分,每一列表示mel频率倒谱的系数(因此为MFCC)。空行分隔声音文件。我正在考虑为分类目标类创建一个列,但不确定如何标记它,因为每个声音文件都有多行。块中的每一行是否来自所有声音文件的相同时间段。还是随机的?那你想做什么?将声音文件A作为特征传递,B作为类传递?为了清晰起见,我重新表述了我的问题。现在的问题包括一个链接。我的数据集看起来就是这样,我想知道如何将其输入到机器学习算法中?为什么这些数字之间有一条空线?有分类目标类吗?解释每个块代表一个声音文件的数据。每一行是此类声音文件(20-40ms)的一小部分,每一列表示mel频率倒谱的系数(因此为MFCC)。空行分隔声音文件。我正在考虑为分类目标类创建一个列,但不确定如何标记它,因为每个声音文件都有多行。块中的每一行是否来自所有声音文件的相同时间段。还是随机的?