Character encoding 什么';使用的字符编码是什么?

Character encoding 什么';使用的字符编码是什么?,character-encoding,byte,Character Encoding,Byte,奇数字符代码: ก็็็็็็็็็็็็็็็็็็็็ กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ ก็็็็็็็็็็็็็็็็็็็็ กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ ก็็็็็็็็็็็็็็็็็็็็ กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ ก็็็็็็็็็็็็็็็็็็็็ กิิิิิิิิิิิิิิิิิิิิ

奇数字符代码:

ก็็็็็็็็็็็็็็็็็็็็ กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ ก็็็็็็็็็็็็็็็็็็็็ กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ ก็็็็็็็็็็็็็็็็็็็็ กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ ก็็็็็็็็็็็็็็็็็็็็ กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้

问题:这些字符的编码是什么?


(提示:试着编辑这个问题,你会发现为什么他们很奇怪,现场直播)

是的,没错。你看到的和我一样
显然,这是一个苹果电脑。因此,在我对这个主题知之甚少的情况下,我启动了notepad++并尝试用十六进制来查看它。

结果如何?你自己试试吧:

比较明显,;我勒个去? 我能理解它是否只是一些奇怪的专有二进制编码(包含颜色、字体等内容)中的一串位。但为什么他们会表现得如此奇怪


另外,为什么记事本++不从一开始就显示原始字符?如果你打开十六进制编辑器,然后关闭它,它就像它展开


(同样(再次)尝试将上述字符复制粘贴到记事本++中两次。看到区别了吗?除了
0x3f
和偶尔出现的
0x20
。这对每个字符都是正确的。据我所知,空格和问号看起来都不像上述字符。但是,哦,我当然可能错了。)

以下是outlook中的一个片段:

编辑:使用
UTF-8
而不是愚蠢的
ANSI
编辑这些字符实际上可以让您看到正确的字节

编辑2:当我写这个问题的时候,我可能应该更清楚地知道我想知道什么(为我辩护,我太恶心了,当我看到它[截图]时,我只想尖叫
BRAINOVERFLOW

编辑3:(复制自yahoo answer) 这似乎是一种使用泰国字符的“堆叠变音符号”

本质上是泰国人的性格ก “ko kai”可以有几个上标的变音符号中的任意一个,例如็ “maitaikhu”。如果您在“ko kai”后面加上“maitaikhu”,后者将显示为上标,因此:ก็

如果在这样一个组合之后再加上一些变音符号,它们就会叠加在一起:ก็็็็็


以下是可以完成此操作的字符:…

在gnome charmap上轻松搜索:

U+0E01 THAI CHARACTER KO KAI

General Character Properties

In Unicode since: 1.1
Unicode category: Letter, Other

Various Useful Representations

UTF-8: 0xE0 0xB8 0x81
UTF-16: 0x0E01

C octal escaped UTF-8: \340\270\201
XML decimal entity: ก
后跟(一个或多个/的变化):


第二个是一个非间隔标记,用于装饰第一个字符

在上的搜索框中输入这些字符将带您到,显示正在使用的不同字符:


这太棒了,也许这属于meta-tough?我不认为这是特定于SO的。这真是太棒了!比萨丸:不,实际上不是。这并不是特定于此;问题是关于问题顶部的字符串。相关:编码显然是UTF-8,如果OP真的想知道的话。也许Windows在泰国组合变音符号方面有问题?在我的iPhone上,它们是重叠的,而不是像屏幕截图中那样堆叠。linux上的Chrome在第三、第六和第九个组合上遇到了同样的问题(堆叠变音符号),而它覆盖了其他组合。我认为这取决于一个字符后面有许多相邻的变音符号,而可能只需要一个。
U+0E47 THAI CHARACTER MAITAIKHU

General Character Properties

In Unicode since: 1.1
Unicode category: Mark, Non-Spacing

Various Useful Representations

UTF-8: 0xE0 0xB9 0x87
UTF-16: 0x0E47

C octal escaped UTF-8: \340\271\207
XML decimal entity: ็

Annotations and Cross References

Alias names:
 • mai taikhu