String ICU中的适当标题案例[ICU是否有非大写单词列表?]

String ICU中的适当标题案例[ICU是否有非大写单词列表?],string,icu,capitalization,title-case,String,Icu,Capitalization,Title Case,是否可以使用ICU4C获得适当的大写字母,例如英语文本,但不必构建任何自定义的非大写单词集?比如说,给定对峡湾的渴望我想获得对峡湾的渴望 有了ucasemap\u utf8ToTitle()和UnicodeString::toTitle,无论我使用哪种BreakIterator或语言环境,我都会对峡湾产生渴望。@Jongware应该会因为解释得这么好而得到赞扬。你的问题可能是-ICU是否有非大写单词列表 但ICU的简单答案是:不 CLDR(ICU从中获取其数据)过去常常有“停止词”用于搜索目的,

是否可以使用ICU4C获得适当的大写字母,例如英语文本,但不必构建任何自定义的非大写单词集?比如说,给定
对峡湾的渴望
我想获得
对峡湾的渴望


有了
ucasemap\u utf8ToTitle()
UnicodeString::toTitle
,无论我使用哪种
BreakIterator
或语言环境,我都会对峡湾产生
渴望。

@Jongware应该会因为解释得这么好而得到赞扬。你的问题可能是-ICU是否有非大写单词列表

但ICU的简单答案是:不


CLDR(ICU从中获取其数据)过去常常有“停止词”用于搜索目的,但它们没有得到很好的维护和删除:

这太依赖于语言(您需要一个停止词列表,如文章和命题)而无法概括。此外,这可能取决于上下文:“我在电视上看过《逝者》。最后,这是一个优先选择哪个单词大写,哪个不大写的问题。我有相同的印象。@Jongware,我决定使用ICU的BreakIterator迭代每个单词,并与我自己的停止词列表进行比较。你好,Steven,你的帖子已经有几年了,我刚刚用最新的(ICU 68.1)进行了测试“停止语”不由toTitle处理。我想知道是否有任何C/C++覆盖或使用停止字的演示代码可用。谢谢,你好,卡罗琳。我认为情况没有任何变化,如前所述,这些都没有得到维持。如果你有一个保持停止词及其有用性的来源,可以重新访问。