使用java对不同语言进行断字

使用java对不同语言进行断字,java,internationalization,hyphenation,Java,Internationalization,Hyphenation,问题:给定一个字符串(可以是不同的语言),我们必须将其连字符 我尝试的内容:但这似乎只适用于英语,我不确定如何连接其他语言,无法找到不同语言的免费tex文件 我们有哪些选项可以解决java中不同语言的断字问题?如果有足够的时间和意志力,您可以根据本文自己实现断字。 不过,自行实现断字并非易事,因此您可能希望选择其他解决方案 Hyphenator.js 是的,这是一个javascript项目。但是,可以从java调用javascript函数。您可以在此处找到有关此的更多信息: 这提供了对多种语言的

问题:给定一个字符串(可以是不同的语言),我们必须将其连字符

我尝试的内容:但这似乎只适用于英语,我不确定如何连接其他语言,无法找到不同语言的免费tex文件


我们有哪些选项可以解决java中不同语言的断字问题?

如果有足够的时间和意志力,您可以根据本文自己实现断字。 不过,自行实现断字并非易事,因此您可能希望选择其他解决方案

Hyphenator.js 是的,这是一个javascript项目。但是,可以从java调用javascript函数。您可以在此处找到有关此的更多信息:

这提供了对多种语言的支持

刮字典 许多字典都提供断字规则。你可以在网上找到这些,尽管这需要一些搜索。接下来,您可以根据断字规则删除这些代码,但这可能是比从Java调用javascript更糟糕的解决方法


无论哪种方式,断字都不是一个容易的问题,自己实现它似乎是一个相当烦人的任务,所以javascript项目可能是您最好的选择。或者,您可以基于hyphenator.js实现自己的Java实现。至少你不会从头开始。

断字器-j或forked的实现能够使用原始的
.tex
断字表

这两个表都可以找到

  • 如果您已经在本地计算机上安装了TeX环境,如
    MiKTeX
    。在这种情况下,可以在
    \tex\generic\hyphen
  • 在TeX用户组和相应Git的网页上:

获得感兴趣的
.tex
后,可以使用
hyphenator-j

提供的API加载它们。是否搜索tex断字表