C 如何使用线性预测编码压缩语音双音样本?
我正在为我的母语做一个实验性的双音语音合成器,它缺少适合盲人的语音合成器 问题是录制的双音库可能会变得非常庞大(数百兆字节,正如最好的语音合成器所示) 我见过一些高质量的双音合成器,带有小型语音样本库。当阅读关于语音合成的各种论文,特别是关于那些较小的合成器的论文时,他们说他们已经使用了LPC(线性预测编码)使他们的语音样本库小得多,并且他们还说LPC使他们在从语音样本中组合语音时更容易进行基音控制 不幸的是,我找不到任何关于使用LPC压缩语音样本的入门级教程。我找到的所有材料都是大学水平的数学。我想我不需要为了使用LPC而学习所有这些(如果我可以在我的软件中使用FFT库来生成频率图,我应该能够以类似的“黑盒”方式使用LPC库,对吧?) 我找到的唯一或多或少“生产就绪”的代码似乎是: 它有四个与LPC相关的文件夹——openlpc、LPC、lpc10和celp。它们的头文件只有几个功能,但不幸的是,没有单元测试或教程演示它们在语音样本压缩/解压缩中的用法 请有DSP经验的人看一看,并对这些功能进行一些解释?例如,本文件中的功能: 我想看一个简单的演示,将原始PCM波字节(以什么格式?)送入LPC编码器进行压缩,然后将压缩数据连同其他参数(它们的值和对解码结果的影响是什么?)一起送入LPC解码器 openlpc、lpc、lpc10和celp之间有什么区别,以及哪一个最适合我的目的? 我也对其他LPC压缩/解压缩解决方案持开放态度,以防您能提出比上面VoiceCodec项目代码更好、更完整的文档 注意-请不要解释LPC的内部工作原理;在我的例子中,这就像向一个只想学开车的人解释燃料化学一样C 如何使用线性预测编码压缩语音双音样本?,c,compression,signal-processing,speech-synthesis,C,Compression,Signal Processing,Speech Synthesis,我正在为我的母语做一个实验性的双音语音合成器,它缺少适合盲人的语音合成器 问题是录制的双音库可能会变得非常庞大(数百兆字节,正如最好的语音合成器所示) 我见过一些高质量的双音合成器,带有小型语音样本库。当阅读关于语音合成的各种论文,特别是关于那些较小的合成器的论文时,他们说他们已经使用了LPC(线性预测编码)使他们的语音样本库小得多,并且他们还说LPC使他们在从语音样本中组合语音时更容易进行基音控制 不幸的是,我找不到任何关于使用LPC压缩语音样本的入门级教程。我找到的所有材料都是大学水平的数学