Internationalization 重症监护病房';s collator假设;a「;及ą&引用;都一样

Internationalization 重症监护病房';s collator假设;a「;及ą&引用;都一样,internationalization,collation,icu,Internationalization,Collation,Icu,我正在使用立陶宛语(lt\u lt)的ICU。这种语言的字母表如下:aąb cčd eęv zž 然而,在排序时,ICU的collator假设,例如,a和ą(a与ogonek)是等效的,因此立陶宛语单词列表的排序如下: a, ą, ab, aba, abadas, <...>, b, ba, <...>` a,ą,ab,aba,abadas,b,ba` 预期结果将是: a, ab, aba, abadas, <...>, ą, <...>, b

我正在使用立陶宛语(
lt\u lt
)的ICU。这种语言的字母表如下:
aąb cčd eęv zž

然而,在排序时,ICU的collator假设,例如,
a
ą
a
与ogonek)是等效的,因此立陶宛语单词列表的排序如下:

a, ą, ab, aba, abadas, <...>, b, ba, <...>`
a,ą,ab,aba,abadas,b,ba`
预期结果将是:

a, ab, aba, abadas, <...>, ą, <...>, b, ba, <...>
a,ab,aba,abadas,ą,b,ba,
其他“重音”字母也是如此(
e
-
ę
-
ė
z
-
ž
等)

更具体的测试用例:运行
source/samples/coll/coll-locale lt_lt-sourceą-target aa
决定
源代码小于目标代码(如果不是这样的话)(请查看是否需要)


这是预期的行为吗?这是一个bug还是一个特性?如果是这样,我如何防止ICU的拼贴器将“相似”的字母对齐在一起?

这些字母在CLDR裁剪中列为次要差异,因此它们将进行排序。如果这是错误的,把它提出来,而不是ICU的问题。同意。

您最好询问重症监护病房名单。