用于标记的Unicode字符

用于标记的Unicode字符,unicode,Unicode,我们将把许多书数字化。我们希望在不影响数字图书流通的情况下,在原始图书中标记断线的位置。哪种不可见的Unicode证书可用于标记原始文件中的某些特殊位置 (\n将用于表示段落结尾) 要替换的正确字符是什么*: This is a sentence * in the original book that * I want to mark line *break places. 使用换行符(LF,“\n”,0x0A)和/或回车符(CR,“\r”,0x0D)。 例如,用于此目的的常规字符。使用换

我们将把许多书数字化。我们希望在不影响数字图书流通的情况下,在原始图书中标记断线的位置。哪种不可见的Unicode证书可用于标记原始文件中的某些特殊位置

(\n将用于表示段落结尾)

要替换的正确字符是什么
*

This  is  a sentence * in the original book that * I want to mark line *break places.

使用换行符(LF,
“\n”
0x0A
)和/或回车符(CR,
“\r”
0x0D
)。

例如,用于此目的的常规字符。

使用换行字符(LF,
“\n”
0x0A
)和/或回车符(CR,
“\r”
0x0D
)。

例如,用于此目的的常规字符。

Unicode没有隐藏字符的概念,该隐藏字符在某些原始字符中表示换行符,但在呈现时不会导致换行符。Unicode编码纯文本数据,其换行符的控制字符在呈现纯文本时起作用

这里重要的是如何使用这些文件。如果需要使用纯文本编辑器处理换行符,则需要决定:要么在默认呈现中复制换行符,要么在创建文件时忽略换行符。你不能让他们隐形。不同的文本编辑器,如记事本和Emacs,可能会使用不同的行控制约定;一个程序的行尾是另一个程序的段落结尾

如果文件仅由您创建的程序处理,那么您可以使用您喜欢的任何约定。最符合逻辑的是: “行和段分隔符。Unicode标准提供两个明确的字符, U+2028行分隔符和U+2029段落分隔符,用于分隔行和 段落。它们被认为是表示行和段落边界的默认形式 在Unicode纯文本中。每行分隔符后都有一个新行开始。一个新段落 在每个段落分隔符后开始。由于这些字符是分隔符代码,因此不必以第一行或段落开头,也不必以最后一行或段落结尾。这样做将表明后面有一个空段落或行。段落分隔符可以插入文本段落之间。它的使用创建纯文本文件,可在接收端以不同的线宽排列。行分隔符可用于指示无条件的行尾。” (PDF第6页和第7页)


请注意,文本编辑器通常不理解U+2028和U+2029。它们适合以纯文本格式存储数据。当要渲染文本时,渲染软件可以选择忽略原始的分为几行,并将U+2028视为等效于空格,除非前面有连字符(如果没有更高级别的信息,这会造成无法解决的问题:以“foo-”结尾的行,后面是以开头的行)“bar”可以表示“foobar”一词,用连字符表示换行,也可以表示连字符复合词“foobar”,或者在某些情况下表示组合词“foo-bar”).

Unicode没有隐藏字符的概念,该隐藏字符在某些原始文件中表示换行符,但在呈现时不会导致换行符。Unicode对纯文本数据进行编码,其换行符的控制字符在呈现纯文本时起作用

这里重要的是如何使用文件。如果需要使用纯文本编辑器处理这些文件,那么您需要决定:要么在默认呈现中复制换行符,要么在创建文件时忽略它们。您不能使它们不可见。不同的文本编辑器,如记事本和Emacs,可能会使用不同的换行符控制约定;一个程序的行尾是另一个程序的段落结尾

如果文件仅由您创建的程序处理,那么您可以使用您喜欢的任何约定。最符合逻辑的约定是: “行和段分隔符。Unicode标准提供两个明确的字符, U+2028行分隔符和U+2029段落分隔符,用于分隔行和 段落。它们被认为是表示行和段落边界的默认形式 在Unicode纯文本中。每行分隔符后都有一个新行开始。一个新段落 在每个段落分隔符后开始。由于这些字符是分隔符代码,因此不必以第一行或段落开头,也不必以最后一行或段落结尾。这样做将表明后面有一个空段落或行。段落分隔符可以插入文本段落之间。它的使用创建纯文本文件,可在接收端以不同的线宽排列。行分隔符可用于指示无条件的行尾。” (PDF第6页和第7页)


请注意,文本编辑器通常不理解U+2028和U+2029。它们适用于以纯文本格式存储数据。在渲染文本时,渲染软件可以选择忽略原始的行分割,并将U+2028视为等同于空格,除非前面有连字符(如果没有更高级别的信息,这个问题是无法解决的:以“foo-”结尾的一行,后面是以“bar”开头的一行,可以表示“foobar”一词为断行连字号,或者是连字号复合词“foobar”,或者在某些情况下是组合词“foo-bar”).

如前所述,我正在寻找一个不会影响文本流的字符。它只会用于编程目的。换行符本身不会影响文本流,因为它没有说明文本将如何输出。当然,你可以为此滥用任何其他不可见字符,但当exactl已经有一个角色了
This  is  a sentence * in the original book that * I want to mark line *break places.