相同的符号,但Javascript中有两个UTF-8(.normalize()无法解析) 我对Unicode符号有异议。与前面的标题一样,我使用.normalize函数将两个符号转换为标准utf-8代码。我想它能涵盖我所有的问题,但事实并非如此。 在我的例子中,两个Đ符号有两个utf-8代码:\xC3\x90和\xC4\x90。你可以去看看 javascript规范化函数不能将它们转换为一个utf-8代码。 我需要你的建议。代码块或库,任何东西。非常感谢。

相同的符号,但Javascript中有两个UTF-8(.normalize()无法解析) 我对Unicode符号有异议。与前面的标题一样,我使用.normalize函数将两个符号转换为标准utf-8代码。我想它能涵盖我所有的问题,但事实并非如此。 在我的例子中,两个Đ符号有两个utf-8代码:\xC3\x90和\xC4\x90。你可以去看看 javascript规范化函数不能将它们转换为一个utf-8代码。 我需要你的建议。代码块或库,任何东西。非常感谢。,javascript,string,unicode,utf-8,Javascript,String,Unicode,Utf 8,这只是两个不同的字母,一个大写的Eth U+00D0和一个大写的带有笔划U+0110的D。它们是不可互换的,所以它们不能正常化为相同的字符。即使它们看起来是一样的 许多其他角色也是如此。例如,俄语字母СU+0421看起来就像一个C U+0043,但它不是同一个字母;当把俄语翻译成ASCII码时,你会得到一个S 所以你不能把所有的长相都相互转换;不是没有信息的损失 如果你解释你的用例是什么,也许有人能想出一个解决方案。但是没有一个通用的库可以解决某些字符看起来和其他字符一样的问题。你现在删除的评论

这只是两个不同的字母,一个大写的Eth U+00D0和一个大写的带有笔划U+0110的D。它们是不可互换的,所以它们不能正常化为相同的字符。即使它们看起来是一样的

许多其他角色也是如此。例如,俄语字母СU+0421看起来就像一个C U+0043,但它不是同一个字母;当把俄语翻译成ASCII码时,你会得到一个S

所以你不能把所有的长相都相互转换;不是没有信息的损失


如果你解释你的用例是什么,也许有人能想出一个解决方案。但是没有一个通用的库可以解决某些字符看起来和其他字符一样的问题。

你现在删除的评论说谷歌搜索做到了,但你的意思是你可以在谷歌中键入Ð,它也可以找到其他Đ的页面吗?你能举个例子吗?是的,谷歌搜索,可视代码可能更有用。我正在搜索覆盖所有其他情况的映射数据文件。