Java 单词break规则文件

Java 单词break规则文件,java,icu,Java,Icu,IBM显然已经为Unicode和全球化支持开放了ICU源代码,其中一部分是文本边界定位器,用于检测文本中的断点位置 但是,中断检测依赖于规则,我无法在任何地方找到规则文件 我在哪里可以获得com.ibm.icu.text.BreakIterator和com.ibm.icu.text.RuleBasedBreakIterator的单词break rules文本文件?保存ibm根据开源许可证发布的icu4j的所有源代码。这包括边界分析,比如字典和基于规则的中断迭代器 但是,似乎没有适合阅读的文本文件

IBM显然已经为Unicode和全球化支持开放了ICU源代码,其中一部分是文本边界定位器,用于检测文本中的断点位置

但是,中断检测依赖于规则,我无法在任何地方找到规则文件

我在哪里可以获得
com.ibm.icu.text.BreakIterator
com.ibm.icu.text.RuleBasedBreakIterator
的单词break rules文本文件?

保存ibm根据开源许可证发布的icu4j的所有源代码。这包括边界分析,比如字典和基于规则的中断迭代器

但是,似乎没有适合阅读的文本文件。我不确定IBM是否会将他们的规则集作为开源发布(因为这对他们来说是一个很大的技术优势)。相反,我们的想法是创建您自己的规则集,这是一个教程

该教程还指出,您可以通过运行以下命令来转储默认规则:

RuleBasedBreakIterator rbbi = (RuleBasedBreakIterator)
    BreakIterator.getWordInstance(Locale.getDefault());
String defaultRules = rbbi.toString();

呵呵?你把我弄丢了。关于这是什么的一点背景如何,也许放在相关的标签里?这不是一个真正的问题。是的,但它确实需要更多的背景,这样我们才知道你在说什么。