如何在python中获得GFCC而不是MFCC？_Python_Audio_Artificial Intelligence_Mfcc_Librosa

如何在python中获得GFCC而不是MFCC？

python audio artificial-intelligence

如何在python中获得GFCC而不是MFCC？,python,audio,artificial-intelligence,mfcc,librosa,Python,Audio,Artificial Intelligence,Mfcc,Librosa,今天，我在python中使用librosa的MFCC，代码如下。它给出了一个维数为（40,40）的数组有没有类似的方法从另一个库中提取GFCC？我找不到它利布罗萨例如essentia：我一直面临着类似的问题，因此我编写了一个名为的小型库，它简化了从音频文件中提取特征的过程。在支持的功能中有GFCC。提取过程如下所示： import scipy from spafe.features.gfcc import gfcc # read wav fs, sig = scipy.io.wa

今天，我在python中使用librosa的MFCC，代码如下。它给出了一个维数为（40,40）的数组

有没有类似的方法从另一个库中提取GFCC？我找不到它利布罗萨

例如essentia：

我一直面临着类似的问题，因此我编写了一个名为的小型库，它简化了从音频文件中提取特征的过程。在支持的功能中有GFCC。提取过程如下所示：

import scipy
from spafe.features.gfcc import gfcc

# read wav 
fs, sig = scipy.io.wavfile.read("test.wav")

# compute features
gfccs = gfcc(sig, fs=fs, num_ceps=13)

您可以在下面找到GFCC提取的完整示例（如jupyter笔记本）

所有可能输入变量及其重要性的文档可在以下位置获得：

gfcc的实施如下所示

我一直面临类似的问题，因此我编写了一个名为的小型库，它简化了从音频文件中提取功能。在支持的功能中有GFCC。提取过程如下所示：

import scipy
from spafe.features.gfcc import gfcc

# read wav 
fs, sig = scipy.io.wavfile.read("test.wav")

# compute features
gfccs = gfcc(sig, fs=fs, num_ceps=13)

您可以在下面找到GFCC提取的完整示例（如jupyter笔记本）

所有可能输入变量及其重要性的文档可在以下位置获得：

gfcc的实施如下所示 提供gfcc、mfcc、光谱和色度特征提取功能，以及分类、交叉验证和超参数调整功能。自述文件介绍了入门方法以及如何运行分类的示例。

提供了gfcc、mfcc、光谱和色度特征提取功能以及分类、交叉验证和超参数调整。

自述文件介绍了入门方法以及如何运行分类的示例。

如何确定输出形状？我的意思是num_ceps可以通过paramater num_ceps计算，但是如何获得num_帧的数量呢？另外，我注意到你函数的结果是librosa结果的转置，对吗？你可以使用

gfccs计算输出矩阵的形状。shape

，这将返回2d输出矩阵shape

（m，n）

，其中（m=帧数，n=num\ceps）。帧数可以通过输入波持续时间

=len（sig）/fs

、fames长度

win\u len

和帧重叠

win\u hop

计算得出。嗨，SuperKogito，你能告诉我哪里可以找到gtcc特征提取代码吗？我可以用gfcc代替gtcc吗？谢谢这是代码：您能重新表述第二个问题吗？我如何确定输出形状？我的意思是num_ceps可以通过paramater num_ceps计算，但是如何获得num_帧的数量呢？另外，我注意到你函数的结果是librosa结果的转置，对吗？你可以使用

gfccs计算输出矩阵的形状。shape

，这将返回2d输出矩阵shape

（m，n）

，其中（m=帧数，n=num\ceps）。帧数可以通过输入波持续时间

=len（sig）/fs

、fames长度

win\u len

和帧重叠

win\u hop

计算得出。嗨，SuperKogito，你能告诉我哪里可以找到gtcc特征提取代码吗？我可以用gfcc代替gtcc吗？谢谢这是密码：你能重新措辞第二个问题吗。

import scipy
from spafe.features.gfcc import gfcc

# read wav 
fs, sig = scipy.io.wavfile.read("test.wav")

# compute features
gfccs = gfcc(sig, fs=fs, num_ceps=13)