如何在python中获得GFCC而不是MFCC?
今天,我在python中使用librosa的MFCC,代码如下。它给出了一个维数为(40,40)的数组 有没有类似的方法从另一个库中提取GFCC?我找不到它 利布罗萨 例如essentia:如何在python中获得GFCC而不是MFCC?,python,audio,artificial-intelligence,mfcc,librosa,Python,Audio,Artificial Intelligence,Mfcc,Librosa,今天,我在python中使用librosa的MFCC,代码如下。它给出了一个维数为(40,40)的数组 有没有类似的方法从另一个库中提取GFCC?我找不到它 利布罗萨 例如essentia: 我一直面临着类似的问题,因此我编写了一个名为的小型库,它简化了从音频文件中提取特征的过程。在支持的功能中有GFCC。提取过程如下所示: import scipy from spafe.features.gfcc import gfcc # read wav fs, sig = scipy.io.wa
我一直面临着类似的问题,因此我编写了一个名为的小型库,它简化了从音频文件中提取特征的过程。在支持的功能中有GFCC。提取过程如下所示:
import scipy
from spafe.features.gfcc import gfcc
# read wav
fs, sig = scipy.io.wavfile.read("test.wav")
# compute features
gfccs = gfcc(sig, fs=fs, num_ceps=13)
您可以在下面找到GFCC提取的完整示例(如jupyter笔记本)
所有可能输入变量及其重要性的文档可在以下位置获得:
gfcc的实施如下所示
我一直面临类似的问题,因此我编写了一个名为的小型库,它简化了从音频文件中提取功能。在支持的功能中有GFCC。提取过程如下所示:
import scipy
from spafe.features.gfcc import gfcc
# read wav
fs, sig = scipy.io.wavfile.read("test.wav")
# compute features
gfccs = gfcc(sig, fs=fs, num_ceps=13)
您可以在下面找到GFCC提取的完整示例(如jupyter笔记本)
所有可能输入变量及其重要性的文档可在以下位置获得:
gfcc的实施如下所示
提供gfcc、mfcc、光谱和色度特征提取功能,以及分类、交叉验证和超参数调整功能。
自述文件介绍了入门方法以及如何运行分类的示例。提供了gfcc、mfcc、光谱和色度特征提取功能以及分类、交叉验证和超参数调整。
自述文件介绍了入门方法以及如何运行分类的示例。如何确定输出形状?我的意思是num_ceps可以通过paramater num_ceps计算,但是如何获得num_帧的数量呢?另外,我注意到你函数的结果是librosa结果的转置,对吗?你可以使用
gfccs计算输出矩阵的形状。shape
,这将返回2d输出矩阵shape(m,n)
,其中(m=帧数,n=num\ceps)。帧数可以通过输入波持续时间=len(sig)/fs
、fames长度win\u len
和帧重叠win\u hop
计算得出。嗨,SuperKogito,你能告诉我哪里可以找到gtcc特征提取代码吗?我可以用gfcc代替gtcc吗?谢谢这是代码:您能重新表述第二个问题吗?我如何确定输出形状?我的意思是num_ceps可以通过paramater num_ceps计算,但是如何获得num_帧的数量呢?另外,我注意到你函数的结果是librosa结果的转置,对吗?你可以使用gfccs计算输出矩阵的形状。shape
,这将返回2d输出矩阵shape(m,n)
,其中(m=帧数,n=num\ceps)。帧数可以通过输入波持续时间=len(sig)/fs
、fames长度win\u len
和帧重叠win\u hop
计算得出。嗨,SuperKogito,你能告诉我哪里可以找到gtcc特征提取代码吗?我可以用gfcc代替gtcc吗?谢谢这是密码:你能重新措辞第二个问题吗。
import scipy
from spafe.features.gfcc import gfcc
# read wav
fs, sig = scipy.io.wavfile.read("test.wav")
# compute features
gfccs = gfcc(sig, fs=fs, num_ceps=13)