Javascript 日文表意文字和全宽句号是否都映射为ASCII句号?

Javascript 日文表意文字和全宽句号是否都映射为ASCII句号?,javascript,unicode,cjk,normalize,Javascript,Unicode,Cjk,Normalize,我注意到NFKC unicode标准化(至少在JavaScript中)并没有将日语表意符句号(.)标准化为ASCII句号,但它确实将日语全幅句号(.)标准化为ASCII句号 '。'.normalize('NFKC') > '。' '.'.normalize('NFKC') > '.' 是否只有后者映射到ASCII句号 在Mac OS X中,为了标点符号的目的,您可以选择其中一种,因此有点混乱。调用“.”“半停”是…混乱的。这是表意文字的句号。另一个是全宽句号。@deceze很好的一

我注意到NFKC unicode标准化(至少在JavaScript中)并没有将日语表意符句号(.)标准化为ASCII句号,但它确实将日语全幅句号(.)标准化为ASCII句号

'。'.normalize('NFKC')
> '。'
'.'.normalize('NFKC')
> '.'
是否只有后者映射到ASCII句号


在Mac OS X中,为了标点符号的目的,您可以选择其中一种,因此有点混乱。

调用“.”“半停”是…混乱的。这是表意文字的句号。另一个是全宽句号。@deceze很好的一点,修正了-谢谢。西文标点符号和日文标点符号不完全兼容。Max OS/Windows具有可选择的默认标点符号的原因是,历史上有一些人甚至在日文文本(例如,学术/工程领域)中也喜欢使用源自西方的标点符号。对于其他大多数人来说,在日文文本中用“.”替换“.”从来都不被认为是一种“标准化”。@AdamThompson.”在日文数字中不被用作小数点,因此它们不能自动交换。例如,如果在日语文本中有一个类似“123.45”的字符串,它永远不能表示“123.45”,而是一个句子以“123”结尾,另一个句子以“45”开头。在精确的定义中,日语的句号字母是纯句号,而英语的句号字母是句号或小数点,这取决于上下文。@AdamThompson现在日本人在日语文本中使用阿拉伯数字和(.)。泛华文化也有小方向的数字名称。比如说百万,亿等等,小规模的,有pow(10,-1),pow(10,-2)的名字。。。因此,甚至在阿拉伯语系统引入之前,就可以对其进行描述。没有零和小数点的概念,就像古罗马数字系统(MMXIX=2019)没有一样。调用“半停”是…令人困惑的。这是表意文字的句号。另一个是全宽句号。@deceze很好的一点,修正了-谢谢。西文标点符号和日文标点符号不完全兼容。Max OS/Windows具有可选择的默认标点符号的原因是,历史上有一些人甚至在日文文本(例如,学术/工程领域)中也喜欢使用源自西方的标点符号。对于其他大多数人来说,在日文文本中用“.”替换“.”从来都不被认为是一种“标准化”。@AdamThompson.”在日文数字中不被用作小数点,因此它们不能自动交换。例如,如果在日语文本中有一个类似“123.45”的字符串,它永远不能表示“123.45”,而是一个句子以“123”结尾,另一个句子以“45”开头。在精确的定义中,日语的句号字母是纯句号,而英语的句号字母是句号或小数点,这取决于上下文。@AdamThompson现在日本人在日语文本中使用阿拉伯数字和(.)。泛华文化也有小方向的数字名称。比如说百万,亿等等,小规模的,有pow(10,-1),pow(10,-2)的名字。。。因此,甚至在阿拉伯语系统引入之前,就可以对其进行描述。没有零和小数点的概念,正如古罗马数字系统(MMXIX=2019)没有零和小数点一样。