Ruby 这两种字符编码之间的区别是什么å&引用;(195165)及;å&引用;(97, 204, 138)
这两个字节序列似乎在Chrome和my text editor中都能正确呈现,但后者在PDF文档中会导致一些布局问题 以下是字节序列(十进制):Ruby 这两种字符编码之间的区别是什么å&引用;(195165)及;å&引用;(97, 204, 138),ruby,unicode,utf-8,character-encoding,Ruby,Unicode,Utf 8,Character Encoding,这两个字节序列似乎在Chrome和my text editor中都能正确呈现,但后者在PDF文档中会导致一些布局问题 以下是字节序列(十进制): å:195165 答:97204138 我可以看出,195165是UTF-8的预期序列: 97204138是否也是对UTF-8字符串的字符进行编码的有效方法?或者这是一种不同的编码,只是碰巧在某些上下文中起作用 我正在使用Ruby编程语言。我有没有办法检测到用户何时使用97204138编码提交此类字符,并将这些字符安全地转换为195165编码?我发
- å:
195165
- 答:
97204138
195165
是UTF-8的预期序列:
97204138
是否也是对UTF-8字符串的字符进行编码的有效方法?或者这是一种不同的编码,只是碰巧在某些上下文中起作用
我正在使用Ruby编程语言。我有没有办法检测到用户何时使用
97204138
编码提交此类字符,并将这些字符安全地转换为195165
编码?我发现第一个å字符是一个名为“上面有环的拉丁字母a”的单个字符
第二个å字符是一个普通的字母“a”,后跟“组合环上方”字符,因此实际上是两个单独的字符合并在一起
我使用此服务检查字符:
为了回答问题的第二部分,Ruby确实有一个#unicode_normalize
方法,可以自动将两个字符97204138
序列转换为单个字符:195165
有多种方法可以规范化Unicode(NFD、NFC、NFKD和NFKC),因此本文将更详细地介绍:我发现第一个å字符是一个名为“上面带环的拉丁小写字母a”的单个字符 第二个å字符是一个普通的字母“a”,后跟“组合环上方”字符,因此实际上是两个单独的字符合并在一起 我使用此服务检查字符: 为了回答问题的第二部分,Ruby确实有一个
#unicode_normalize
方法,可以自动将两个字符97204138
序列转换为单个字符:195165
有多种方法可以规范化Unicode(NFD、NFC、NFKD和NFKC),因此本文将更详细地介绍:这是基本的Unicode知识-有很多东西需要您去探索,例如,什么是空格和/或换行符,大小写折叠在哪里失败,无效的代码点/序列,过长的编码。。。包括在一个代码点和它的UTF-8序列之间进行杂耍-请参阅,这是基本的Unicode知识-有很多东西需要探索,例如什么可以是空格和/或换行符,大小写折叠在哪里失败,无效的代码点/序列,过长的编码。。。包括在一个代码点和它的UTF-8序列之间进行杂耍-请参阅,这是否回答了您的问题?这回答了你的问题吗?