Audio 用于音频/声音增强的神经网络

Audio 用于音频/声音增强的神经网络,audio,architecture,neural-network,lstm,recurrent-neural-network,Audio,Architecture,Neural Network,Lstm,Recurrent Neural Network,一个人会使用哪种类型的神经网络结构将声音映射到其他声音?神经网络非常擅长学习从序列到其他序列的转换,因此声音增强/生成似乎是它们的一个非常流行的应用(但不幸的是,它不是-我只能找到一个(相当古老的)洋红项目来处理它,以及其他两篇博文) 假设我有一个足够大的相同长度的输入声音/输出声音数据集,我将如何格式化数据?也许在光谱图上训练CNN(比如cycleGAN或pix2pix),也许使用WAV文件中的实际数据并使用LSTM?有没有其他没人听说过的对声音有好处的怪异建筑?请帮帮我 对于其他做类似事情的

一个人会使用哪种类型的神经网络结构将声音映射到其他声音?神经网络非常擅长学习从序列到其他序列的转换,因此声音增强/生成似乎是它们的一个非常流行的应用(但不幸的是,它不是-我只能找到一个(相当古老的)洋红项目来处理它,以及其他两篇博文)


假设我有一个足够大的相同长度的输入声音/输出声音数据集,我将如何格式化数据?也许在光谱图上训练CNN(比如cycleGAN或pix2pix),也许使用WAV文件中的实际数据并使用LSTM?有没有其他没人听说过的对声音有好处的怪异建筑?请帮帮我

对于其他做类似事情的人来说,答案是使用快速傅立叶变换将数据转换为可管理状态,然后人们通常使用RNN或LSTM来处理数据,而不是CNN