Python 从声谱图重建音频
我已经按照()从声音构造了一个频谱图。我已经将光谱图导出并保存为png图像。我现在想要的是,在matlab或任何其他平台中导入图像,并从中构建音频。我已经阅读了很多帖子和阅读材料,但它们并不涉及从图像生成音频。大多数情况下,他们依靠声音信息进行重建,其中频谱图仅用于可视化目的,仅此而已。附加图像以供参考。在您引用的文档之后:Python 从声谱图重建音频,python,matlab,audio,spectrogram,Python,Matlab,Audio,Spectrogram,我已经按照()从声音构造了一个频谱图。我已经将光谱图导出并保存为png图像。我现在想要的是,在matlab或任何其他平台中导入图像,并从中构建音频。我已经阅读了很多帖子和阅读材料,但它们并不涉及从图像生成音频。大多数情况下,他们依靠声音信息进行重建,其中频谱图仅用于可视化目的,仅此而已。附加图像以供参考。在您引用的文档之后: s = imread('im.png') // see remarks below x = stftmag2sig(s,nfft) // x is your audio
s = imread('im.png') // see remarks below
x = stftmag2sig(s,nfft) // x is your audio
s
是您的图像。OP产生这些光谱图,所以他控制输出。基于此:
- 避免有损图像格式,并确保不会发生重缩放/插值。您的像素应该包含来自给定时间窗口(
)和频率槽的振幅nfft
- 要么生成只有光谱图(无轴)的图像,要么知道光谱图的精确坐标
- 不要在光谱图中使用颜色。它看起来不错,但对于如何将三元组颜色映射到振幅,引入了完全不必要的歧义