Java ASCII不可读字符28、29和31_Java_Unicode_Ascii

Java ASCII不可读字符28、29和31

java unicode

Java ASCII不可读字符28、29和31,java,unicode,ascii,Java,Unicode,Ascii,我正在处理一个需要根据分隔符拆分的文件下面的代码显示了为我正在处理的文件定义的分隔符 private static final String component = Character.toString((char) 31); private static final String data = Character.toString((char) 29); private static final String segment = Character

我正在处理一个需要根据分隔符拆分的文件

下面的代码显示了为我正在处理的文件定义的分隔符

private static final String    component   = Character.toString((char) 31);
private static final String    data        = Character.toString((char) 29);
private static final String    segment     = Character.toString((char) 28);

有人能解释一下这些特殊分离器的意义吗

查看ASCII码，这些分隔符是文件分隔符、组分隔符和单元分隔符。我真的不明白这意味着什么。

请阅读以理解这些。然后阅读关于使用28、29和31分隔文本的ASCII方法的详细说明。

这些字符是控制字符。它们不是由人类书写或阅读的，而是由计算机书写或阅读的。您应该在程序中像对待任何其他角色一样对待它们。

28–FS–文件分隔符文件分隔符FS是一个有趣的控件代码，因为它让我们对计算机技术的发展方式六十年代组织的。我们现在是用于随机访问RAM等媒体和磁盘，但当定义了标准，大多数数据是电视连续剧我不仅仅是说串行通信，还关于串行存储，如穿孔卡、纸张磁带和磁带。以这样的方式在这种情况下，采取行动显然是有效的有一个单一的控制代码来发送信号两个文件的分离。财政司司长是为此目的而定义的

29–GS–组分隔符数据存储就是其中之一一些控制的主要原因是什么要在ASCII定义中获取的代码。大多数情况下，数据库都是安装程序带有表，包含记录。全部的一个表中的记录具有相同的属性类型，但不同表的记录不同可能会有所不同。组分隔符 GS定义为在一个表中分隔表串行数据存储系统。注意当时没有使用table这个词那一刻，人们称之为一群

30–RS–记录分隔符在组（或表）中，记录用RS或record分隔分离器

31–美国–单元分离器要存储的最小数据项在数据库中，在 ASCII定义。我们会叫他们现在上场。单元分离器以串行方式分隔这些字段数据存储环境。最新数据库实现要求大多数类型的字段都有固定的长度。记录中有足够的空间分配给存储最大每个字段的可能成员，即使在大多数情况下，这是不必要的。这会占用大量的空间很多情况下。美国控制代码允许所有字段都有一个变量长度。如果数据存储空间不足与60年代一样有限，这是一个保护宝贵空间的好方法。另一方面是串行存储比桌子效率低很多的受驱动RAM和磁盘实现现代。我想象不出有什么变化使用现代SQL数据库的情况使用存储在纸上的数据运行磁带或磁带盘

ascii控制字符的范围为28-31。（0x1C至0x1F）

调用示例：

char record_separator = 0x1F;
String s = "hello" + record_separator + "world"

我更喜欢这个答案！它为我节省了很多额外的阅读，并直接解决了这个问题。尽管它只会从添加所选答案中给出的十进制ASCII码中获益。此外，由于我来这里是为了帮助我从聊天应用程序保存的文本文件中删除这些代码，所以给出十六进制代码也很好：1C、1D和1F。关于如何使用正则表达式编写，顺便说一句，请参见此处：

char record_separator = 0x1F;
String s = "hello" + record_separator + "world"