Open source FLOSS项目是否利用人工输入进行语音合成?

Open source FLOSS项目是否利用人工输入进行语音合成?,open-source,text-to-speech,speech-synthesis,Open Source,Text To Speech,Speech Synthesis,是否有任何开源、开放内容的项目使用录制的语音数据生成合成语音?(目标是合成/模拟特定个体的语音。作为旁注,该过程、目标或提取的数据是否有名称?“语音签名”?) 我想工作流程应该是这样的: 录制标准文本中的讲话(“泰迪坐在垫子上”) 挑选音素(猫的“a”),解释口音 获取使Alice的“呃”听起来不同于Betty的“呃”的数据 使用重音合适的音素和语音签名将文本转换为语音 回答这个问题是请愿(,)为了人类的利益将他舒缓的声音签名捐赠给公共领域的一个关键步骤。这是一个由卡内基梅隆大学赞助的项目,

是否有任何开源、开放内容的项目使用录制的语音数据生成合成语音?(目标是合成/模拟特定个体的语音。作为旁注,该过程、目标或提取的数据是否有名称?“语音签名”?)

我想工作流程应该是这样的:

  • 录制标准文本中的讲话(“泰迪坐在垫子上”)
  • 挑选音素(猫的“a”),解释口音
  • 获取使Alice的“呃”听起来不同于Betty的“呃”的数据
  • 使用重音合适的音素和语音签名将文本转换为语音

回答这个问题是请愿(,)为了人类的利益将他舒缓的声音签名捐赠给公共领域的一个关键步骤。

这是一个由卡内基梅隆大学赞助的项目,其目标是在特定演讲者的基础上合成声音。这里描述了这个概念,要正确地调整它听起来是一个非常耗时的过程。上有一个很好的文本到语音的开源项目列表。关于围绕特定扬声器构建TTS引擎,有一个很好的讨论。

这正是我想要的,谢谢!