Tensorflow 如何在语音命令tfjs模型中构造spectrogram

Tensorflow 如何在语音命令tfjs模型中构造spectrogram,tensorflow,tensorflow.js,Tensorflow,Tensorflow.js,我正在尝试使用语音命令tfjs执行脱机识别。然而,我几乎没有关于所需参数或spectrogram是如何构造的信息。我当前的实现执行以下操作: 使用webaudio API(decodeAudioData)从.wav文件获取时域信号 将信号划分为大小为1024的块和大小为1023的跃点(重叠率为.999)。结果块的计数为43 我用大小为1024且alpha=0.16的blackman窗口乘以每个块 我在每个加窗块上应用实fft变换(fftsize=1024) 我将fft截断为232(根据redme

我正在尝试使用语音命令tfjs执行脱机识别。然而,我几乎没有关于所需参数或spectrogram是如何构造的信息。我当前的实现执行以下操作:

  • 使用webaudio API(decodeAudioData)从.wav文件获取时域信号
  • 将信号划分为大小为1024的块和大小为1023的跃点(重叠率为.999)。结果块的计数为43
  • 我用大小为1024且alpha=0.16的blackman窗口乘以每个块
  • 我在每个加窗块上应用实fft变换(fftsize=1024)
  • 我将fft截断为232(根据redme中的要求)
  • 我得到频域信号的能量,单位为dB(20log10 | X |)
  • 然而,我没有得到正确的预测,尽管我使用的是谷歌语音命令数据集。我并不期望它是完美的,但我在许多训练样本上尝试了它,但没有成功

    如果有人能分享任何见解,我将不胜感激