如何在python中获得GFCC而不是MFCC?

如何在python中获得GFCC而不是MFCC?,python,audio,artificial-intelligence,mfcc,librosa,Python,Audio,Artificial Intelligence,Mfcc,Librosa,今天,我在python中使用librosa的MFCC,代码如下。它给出了一个维数为(40,40)的数组 有没有类似的方法从另一个库中提取GFCC?我找不到它 利布罗萨 例如essentia: 我一直面临着类似的问题,因此我编写了一个名为的小型库,它简化了从音频文件中提取特征的过程。在支持的功能中有GFCC。提取过程如下所示: import scipy from spafe.features.gfcc import gfcc # read wav fs, sig = scipy.io.wa

今天,我在python中使用librosa的MFCC,代码如下。它给出了一个维数为(40,40)的数组

有没有类似的方法从另一个库中提取GFCC?我找不到它 利布罗萨

例如essentia:


我一直面临着类似的问题,因此我编写了一个名为的小型库,它简化了从音频文件中提取特征的过程。在支持的功能中有GFCC。提取过程如下所示:

import scipy
from spafe.features.gfcc import gfcc

# read wav 
fs, sig = scipy.io.wavfile.read("test.wav")

# compute features
gfccs = gfcc(sig, fs=fs, num_ceps=13)
您可以在下面找到GFCC提取的完整示例(如jupyter笔记本)

所有可能输入变量及其重要性的文档可在以下位置获得:

gfcc的实施如下所示

我一直面临类似的问题,因此我编写了一个名为的小型库,它简化了从音频文件中提取功能。在支持的功能中有GFCC。提取过程如下所示:

import scipy
from spafe.features.gfcc import gfcc

# read wav 
fs, sig = scipy.io.wavfile.read("test.wav")

# compute features
gfccs = gfcc(sig, fs=fs, num_ceps=13)
您可以在下面找到GFCC提取的完整示例(如jupyter笔记本)

所有可能输入变量及其重要性的文档可在以下位置获得:

gfcc的实施如下所示 提供gfcc、mfcc、光谱和色度特征提取功能,以及分类、交叉验证和超参数调整功能。 自述文件介绍了入门方法以及如何运行分类的示例。

提供了gfcc、mfcc、光谱和色度特征提取功能以及分类、交叉验证和超参数调整。
自述文件介绍了入门方法以及如何运行分类的示例。

如何确定输出形状?我的意思是num_ceps可以通过paramater num_ceps计算,但是如何获得num_帧的数量呢?另外,我注意到你函数的结果是librosa结果的转置,对吗?你可以使用
gfccs计算输出矩阵的形状。shape
,这将返回2d输出矩阵shape
(m,n)
,其中(m=帧数,n=num\ceps)。帧数可以通过输入波持续时间
=len(sig)/fs
、fames长度
win\u len
和帧重叠
win\u hop
计算得出。嗨,SuperKogito,你能告诉我哪里可以找到gtcc特征提取代码吗?我可以用gfcc代替gtcc吗?谢谢这是代码:您能重新表述第二个问题吗?我如何确定输出形状?我的意思是num_ceps可以通过paramater num_ceps计算,但是如何获得num_帧的数量呢?另外,我注意到你函数的结果是librosa结果的转置,对吗?你可以使用
gfccs计算输出矩阵的形状。shape
,这将返回2d输出矩阵shape
(m,n)
,其中(m=帧数,n=num\ceps)。帧数可以通过输入波持续时间
=len(sig)/fs
、fames长度
win\u len
和帧重叠
win\u hop
计算得出。嗨,SuperKogito,你能告诉我哪里可以找到gtcc特征提取代码吗?我可以用gfcc代替gtcc吗?谢谢这是密码:你能重新措辞第二个问题吗。
import scipy
from spafe.features.gfcc import gfcc

# read wav 
fs, sig = scipy.io.wavfile.read("test.wav")

# compute features
gfccs = gfcc(sig, fs=fs, num_ceps=13)