Warning: file_get_contents(/data/phpspider/zhask/data//catemap/5/ruby/21.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Ruby 这两种字符编码之间的区别是什么å&引用;(195165)及;å&引用;(97, 204, 138)_Ruby_Unicode_Utf 8_Character Encoding - Fatal编程技术网

Ruby 这两种字符编码之间的区别是什么å&引用;(195165)及;å&引用;(97, 204, 138)

Ruby 这两种字符编码之间的区别是什么å&引用;(195165)及;å&引用;(97, 204, 138),ruby,unicode,utf-8,character-encoding,Ruby,Unicode,Utf 8,Character Encoding,这两个字节序列似乎在Chrome和my text editor中都能正确呈现,但后者在PDF文档中会导致一些布局问题 以下是字节序列(十进制): å:195165 答:97204138 我可以看出,195165是UTF-8的预期序列: 97204138是否也是对UTF-8字符串的字符进行编码的有效方法?或者这是一种不同的编码,只是碰巧在某些上下文中起作用 我正在使用Ruby编程语言。我有没有办法检测到用户何时使用97204138编码提交此类字符,并将这些字符安全地转换为195165编码?我发

这两个字节序列似乎在Chrome和my text editor中都能正确呈现,但后者在PDF文档中会导致一些布局问题

以下是字节序列(十进制):

  • å:
    195165
  • 答:
    97204138
我可以看出,
195165
是UTF-8的预期序列:

97204138
是否也是对UTF-8字符串的字符进行编码的有效方法?或者这是一种不同的编码,只是碰巧在某些上下文中起作用


我正在使用Ruby编程语言。我有没有办法检测到用户何时使用
97204138
编码提交此类字符,并将这些字符安全地转换为
195165
编码?

我发现第一个å字符是一个名为“上面有环的拉丁字母a”的单个字符

第二个å字符是一个普通的字母“a”,后跟“组合环上方”字符,因此实际上是两个单独的字符合并在一起

我使用此服务检查字符:

为了回答问题的第二部分,Ruby确实有一个
#unicode_normalize
方法,可以自动将两个字符
97204138
序列转换为单个字符:
195165


有多种方法可以规范化Unicode(NFD、NFC、NFKD和NFKC),因此本文将更详细地介绍:

我发现第一个å字符是一个名为“上面带环的拉丁小写字母a”的单个字符

第二个å字符是一个普通的字母“a”,后跟“组合环上方”字符,因此实际上是两个单独的字符合并在一起

我使用此服务检查字符:

为了回答问题的第二部分,Ruby确实有一个
#unicode_normalize
方法,可以自动将两个字符
97204138
序列转换为单个字符:
195165


有多种方法可以规范化Unicode(NFD、NFC、NFKD和NFKC),因此本文将更详细地介绍:

这是基本的Unicode知识-有很多东西需要您去探索,例如,什么是空格和/或换行符,大小写折叠在哪里失败,无效的代码点/序列,过长的编码。。。包括在一个代码点和它的UTF-8序列之间进行杂耍-请参阅,这是基本的Unicode知识-有很多东西需要探索,例如什么可以是空格和/或换行符,大小写折叠在哪里失败,无效的代码点/序列,过长的编码。。。包括在一个代码点和它的UTF-8序列之间进行杂耍-请参阅,这是否回答了您的问题?这回答了你的问题吗?