Encoding 符号和编码:这是什么符号?

Encoding 符号和编码:这是什么符号?,encoding,character-encoding,special-characters,symbols,undefined-symbol,Encoding,Character Encoding,Special Characters,Symbols,Undefined Symbol,我正在处理一个装满数据的大文本文件。不同的数据块被一个看起来有点奇怪的符号(或一对相似的符号)吐出。 我需要找出这是什么符号,以便在读取数据文件时正确地(!)使用它来分割数据块。你能帮我吗 下面是这对符号在Stackoverflow“提问”编辑字段中的外观: 接下来,我添加了一些图片,说明符号在不同的地方看起来有多么不同: 在原始数据文件中 括号内编辑器(与所有可用编码相同) 在浏览器搜索栏中 2019年在Visual Studio中 在Stackoverflow编辑字段中(当我键入和在

我正在处理一个装满数据的大文本文件。不同的数据块被一个看起来有点奇怪的符号(或一对相似的符号)吐出。 我需要找出这是什么符号,以便在读取数据文件时正确地(!)使用它来分割数据块。你能帮我吗

下面是这对符号在Stackoverflow“提问”编辑字段中的外观:

接下来,我添加了一些图片,说明符号在不同的地方看起来有多么不同:

在原始数据文件中

括号内编辑器(与所有可用编码相同)

在浏览器搜索栏中

2019年在Visual Studio中

在Stackoverflow编辑字段中(当我键入和在发布的问题中时不同)

在某个地方,它被转换为以下内容之一

使用C#with Encoding.UTF8编码读取符号时,控制台会给出下一个结果:

但是当使用Encoding.Unicode时,控制台会提供一组无限的smth,如下所示:

我到底需要写些什么才能让我的C代码识别这些符号并对其做出反应?

我用它来找出这些字符是什么

为了他们是

U+0003:文本结束[ETX]


U+0001:标题开始[SOH]

刚刚注意到您无法在上面的文本字段中看到字符,看起来您必须进入编辑模式才能复制/粘贴,甚至只能看到它们。我想这些是unicode中为数不多的“零宽度”字符。哦,谢谢!你能告诉我怎么使用它吗?比如,我从文件中读取行,如果它包含符号,我就断开,例如。如何在代码(Python或C#)中编写它们?Python可以以本机方式打印unicode字符。这篇文章详细介绍了你是如何做到这一点的。我得到了一些关于C#的结果,将它们添加到问题中。。。