Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/395.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/ssis/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java:文本到语音引擎概述_Java_Text To Speech - Fatal编程技术网

Java:文本到语音引擎概述

Java:文本到语音引擎概述,java,text-to-speech,Java,Text To Speech,我现在正在搜索Java文本到语音(TTS)框架。在我的调查中,我发现了上列出的几个JSAPI1.0-(部分)兼容的框架,以及一对似乎不符合JSAPI规范(,)的Java TTS框架。我还注意到,目前还没有JSAPI的参考实现 我对FreeTTS(JSAPI impls页面中列出的第一个)所做的简短测试表明,它远远不能阅读简单而明显的单词(例如:ABC、blackboard)。其他测试目前正在进行中 问题来了(实际上是6个): 您使用过哪些基于Java的TTS框架 根据你的观点,哪些人能够阅读最大

我现在正在搜索Java文本到语音(TTS)框架。在我的调查中,我发现了上列出的几个JSAPI1.0-(部分)兼容的框架,以及一对似乎不符合JSAPI规范(,)的Java TTS框架。我还注意到,目前还没有JSAPI的参考实现

我对FreeTTS(JSAPI impls页面中列出的第一个)所做的简短测试表明,它远远不能阅读简单而明显的单词(例如:ABC、blackboard)。其他测试目前正在进行中

问题来了(实际上是6个):

  • 您使用过哪些基于Java的TTS框架
  • 根据你的观点,哪些人能够阅读最大的词库
  • 他们的声音质量如何
  • 他们的表现如何
  • 现场有哪些带有Java绑定的非Java框架
  • 你推荐哪一种

  • 提前感谢您的评论和建议。

    我以前使用过Mary,声音的质量给我留下了非常深刻的印象。不幸的是,我没有用过其他的任何一个。

    我实际上在这方面运气很好。

    非常感谢大家,诀窍在FreeTTS source中。简而言之:如果在这里作为
    java-jar freetts.jar运行更多的参数
    ,那么它的拼写比以bin/Server.jar和bin/Client.jar的方式执行时要少。

    我使用了提供JSAPI和MS SAPI钩子的方法。它提供高质量的语音、良好的“通用”语音词典、多种发音控制和多种语言。有点贵,但效果很好

    我用它在移动传感器应用程序中向驾驶员读取重要的传感器遥测数据。我们对声音质量没有任何抱怨。科学术语的准确率约为75%,正常对话的准确率更高(可能为90%)。通过使用标记,我们得到了大约99%的准确率(大多数错误都是基于科学术语和不寻常的音素组合)

    这对处理器来说有点难(我们在一台与奔腾III相当的机器上运行,它的CPU峰值提高了50%-75%)。它使用一个带有Java接口的本机语音引擎(与Windows、Linux和Mac兼容)


    语音和语言种类繁多……

    我使用FreeTTS,但在MacbookPro上运行MBrola语音时遇到了一个大问题。我确实让MBrola voices在Windows(痛苦地)和Linux上运行。我没有幸在FreeTTS上加载任何其他语音包,这是一个遗憾,因为提供的语音在我看来很糟糕。除此之外,我在Cloudgarden上也取得了一些成功,但这只在Windows AFAIK上运行。我很想听到其他人在语音引擎方面的成功/失败,因为这类工作特别具有挑战性。我也在玩弄狮身人面像X4。昨晚,我刚刚拆下了JVXML(它似乎基于Sphinx4),但由于一些奇怪的原因,它无法运行。

    我为mary做了贡献。我觉得如果有比我更聪明的人将HMM声音从核心中分离出来(这些声音不需要大数据集,声音正常),这是有潜力的。我还尝试做一个事件系统,当它说一个单词时,释放TTS发送事件。我已经取得了成功,但现在在linux中已经失败了。(可能是因为一个计时器错误)。

    谷歌翻译有一个秘密的tts api:

    事实上,没有什么大的选择:

    • 节日,最古老。用C++编写,但绑定到java。
    • eSpeak,快速简单,谷歌翻译使用
    • 姆博拉
    纯Java:

    • FreeTTS,它的代码是从Festival移植的,然后是开源的,开发也停止了
    • MaryTTS-更强大,看起来可以投入生产
    还有其他专有程序,如:

    • 阿卡佩拉
    • 细微差别发声器

    如果您的软件仅限于Windows,则可以使用Microsoft Speech API。

    我发现它有多种语言和清晰的语音,让人很难理解

    如果不能将语音转换为文本,最好的选择是。
    我举一个大拇指,因为它具有可调、灵活性和可修改的识别器和语法。

    Mary不易使用。它没有很好的文档记录,而且安装过程非常糟糕(目录名中的空格会阻止类文件在基于Unix的系统上被找到)。我尝试了不同的TTS解决方案,最终还是坚持使用MaryTTS。它工作得很好,Maven的设置也不难。我可以推荐。我没有。它击中了Linux Java声音错误,这里描述的是2014年的FreeTTS似乎已经死了。()FreeTTS无法注册除美国之外的任何MBROLA声音,即使他们在页面上提供了其他声音。完全失败,根本无法推荐。死了…………项目死了,但我在Windows上也没有听到声音,但我怀疑这是否有用。我遇到了403错误。请参阅,在Oracle网站上。