有趣奇怪(unicode)字符占用多行

有趣奇怪(unicode)字符占用多行,unicode,character-encoding,zalgo,Unicode,Character Encoding,Zalgo,我发现了一些“有趣”的角色(例如。ḓ在社交媒体中使用多条线路。首先,我认为这是Firefox的bug。我在Gedit和LibreOffice Writer中试过,它们都是一样的。那么,这到底是什么?实际上,我是在问有关字符编码和渲染的问题 我试图在GNOME角色地图中找到角色,但是没有找到 我试图用unicode(可能是UTF-8)检查它们的字符代码。似乎他们需要不止一个角色。为什么一个字符是多个字符?这是使用Python的结果 性格ḓ∗∗∗∗∗∗∗∗∗∗∗∗∗ u'\u2022\u0329\u

我发现了一些“有趣”的角色(例如。ḓ在社交媒体中使用多条线路。首先,我认为这是Firefox的bug。我在Gedit和LibreOffice Writer中试过,它们都是一样的。那么,这到底是什么?实际上,我是在问有关字符编码和渲染的问题

我试图在GNOME角色地图中找到角色,但是没有找到

我试图用unicode(可能是UTF-8)检查它们的字符代码。似乎他们需要不止一个角色。为什么一个字符是多个字符?这是使用Python的结果

性格ḓ∗∗∗∗∗∗∗∗∗∗∗∗∗

u'\u2022\u0329\u0329\u0329\u0329\u0329\u0329\u0329\u0329\u0329\u0329\u0329\u0329
\u0329\u0329\u0329\u0329\u0329\u0329\u0329\u0329\u0329\u0329'
人物

u'\u1e13\u0335\u0319\u034e\u0316\u032f\u031e\u031c\u031e\u032a\u0320\u033c\u031e
\u0320\u034e\u033c\u0353\u034b\u036e\u034c\u0346\u0300\u035c\u0345'

U+0329为零。它是一个组合字符(除U+2022和U+1E13之外的所有其他字符也是如此),这意味着它与前一个字符组合。你在这里看到的只是有人在同一个基础上叠加了太多组合字符的结果。

可能是@JukkaK.Korpela的重复,我不知道它叫Zalgo。谢谢