Tensorflow 如何在语音命令tfjs模型中构造spectrogram_Tensorflow_Tensorflow.js

Tensorflow 如何在语音命令tfjs模型中构造spectrogram

tensorflow

Tensorflow 如何在语音命令tfjs模型中构造spectrogram,tensorflow,tensorflow.js,Tensorflow,Tensorflow.js,我正在尝试使用语音命令tfjs执行脱机识别。然而，我几乎没有关于所需参数或spectrogram是如何构造的信息。我当前的实现执行以下操作：使用webaudio API（decodeAudioData）从.wav文件获取时域信号将信号划分为大小为1024的块和大小为1023的跃点（重叠率为.999）。结果块的计数为43 我用大小为1024且alpha=0.16的blackman窗口乘以每个块我在每个加窗块上应用实fft变换（fftsize=1024）我将fft截断为232（根据redme

我正在尝试使用语音命令tfjs执行脱机识别。然而，我几乎没有关于所需参数或spectrogram是如何构造的信息。我当前的实现执行以下操作：

使用webaudio API（decodeAudioData）从.wav文件获取时域信号

将信号划分为大小为1024的块和大小为1023的跃点（重叠率为.999）。结果块的计数为43

我用大小为1024且alpha=0.16的blackman窗口乘以每个块

我在每个加窗块上应用实fft变换（fftsize=1024）

我将fft截断为232（根据redme中的要求）

我得到频域信号的能量，单位为dB（20log10 | X |）

然而，我没有得到正确的预测，尽管我使用的是谷歌语音命令数据集。我并不期望它是完美的，但我在许多训练样本上尝试了它，但没有成功

如果有人能分享任何见解，我将不胜感激