Audio 用于音频/声音增强的神经网络_Audio_Architecture_Neural Network_Lstm_Recurrent Neural Network

Audio 用于音频/声音增强的神经网络

audio architecture neural-network

Audio 用于音频/声音增强的神经网络,audio,architecture,neural-network,lstm,recurrent-neural-network,Audio,Architecture,Neural Network,Lstm,Recurrent Neural Network,一个人会使用哪种类型的神经网络结构将声音映射到其他声音？神经网络非常擅长学习从序列到其他序列的转换，因此声音增强/生成似乎是它们的一个非常流行的应用（但不幸的是，它不是-我只能找到一个（相当古老的）洋红项目来处理它，以及其他两篇博文）假设我有一个足够大的相同长度的输入声音/输出声音数据集，我将如何格式化数据？也许在光谱图上训练CNN（比如cycleGAN或pix2pix），也许使用WAV文件中的实际数据并使用LSTM？有没有其他没人听说过的对声音有好处的怪异建筑？请帮帮我对于其他做类似事情的

一个人会使用哪种类型的神经网络结构将声音映射到其他声音？神经网络非常擅长学习从序列到其他序列的转换，因此声音增强/生成似乎是它们的一个非常流行的应用（但不幸的是，它不是-我只能找到一个（相当古老的）洋红项目来处理它，以及其他两篇博文）

假设我有一个足够大的相同长度的输入声音/输出声音数据集，我将如何格式化数据？也许在光谱图上训练CNN（比如cycleGAN或pix2pix），也许使用WAV文件中的实际数据并使用LSTM？有没有其他没人听说过的对声音有好处的怪异建筑？请帮帮我

对于其他做类似事情的人来说，答案是使用快速傅立叶变换将数据转换为可管理状态，然后人们通常使用RNN或LSTM来处理数据，而不是CNN