Encoding 如何创建类似ASCII的字符集?

Encoding 如何创建类似ASCII的字符集?,encoding,character,decode,ansi,Encoding,Character,Decode,Ansi,我对过去的实现方式很好奇,我想了解如何实现自己的字符集。ASCII(美国信息交换标准代码)是“原始”字符集,并且仍然是大多数文本数据的基础。ASCII实际上是一个7位代码(数值范围从0到127),字节的最高有效位指示字节的其余部分是指ASCII(如果为零)还是指当前代码页 然后将额外的(非ascii)字符添加到这些代码页中,用户的计算机将加载特定的代码页以供使用。不幸的是,这意味着您需要在查看文件之前加载正确的代码页,否则会出现错误的字符 现在我们继续讨论,大多数系统使用Unicode,这是一种

我对过去的实现方式很好奇,我想了解如何实现自己的字符集。

ASCII(美国信息交换标准代码)是“原始”字符集,并且仍然是大多数文本数据的基础。ASCII实际上是一个7位代码(数值范围从0到127),字节的最高有效位指示字节的其余部分是指ASCII(如果为零)还是指当前代码页

然后将额外的(非ascii)字符添加到这些代码页中,用户的计算机将加载特定的代码页以供使用。不幸的是,这意味着您需要在查看文件之前加载正确的代码页,否则会出现错误的字符

现在我们继续讨论,大多数系统使用Unicode,这是一种可变字符长度(而不是以前使用的单字节字符),可以包含成千上万个字符,允许使用单一编码来满足使用旧的ASCII+代码页方法的多个代码页的需要


这就是简史;至于如何创建自己的字符集,我不确定您想要实现什么-您可以创建自己的字体,但如果您谈论的是实际的字符集(即尚未存在的字符)然后,您必须将您的字符集添加到Unicode等标准中,以便其他计算机可以使用您的新字符,这将是一项相当大的工作(我甚至不知道您会怎么做)——但是,这是值得考虑的,几乎所有存在的字符都已经存在于Unicode中,因此在尝试创建一个全新的字符集等庞大任务之前,您可能需要回顾一下已经完成的工作。

1。根据您的喜好制作一个任意表,将字节映射到字符。2.使用必要的软件教授所选映射的所有相关软件,并使字符显示在屏幕上。(可选:3.获得某些标准机构的批准和/或包含在其他软件中,以使其得到广泛支持。)如果要以电子方式记录,第一步是选择用于文档文件的字符集。☺说得好,说得好——我试图让它尽可能简短,而不是进入角色集的整个历史(因此“原创”不是原创)!并非所有代码页都是ASCII的超集。PC时代非常流行的CP437(IBM OEM)字符集使用图形字符代替大多数控制字符。☺☻♥ ♦ … ▲ ▼虽然它们仍然是控制字符,但如果用作文字字符,它们的解释就是这样的——这是一种添加一些额外有趣字符的技巧。如果您将这些文件的一个文件传输到另一个系统(当时的Atari ST、Amiga等),它们将以不同的方式显示,可能更常见的情况是它们不会打印(因此称为“非打印字符”)。