Unicode 需要ASCII编码完全支持的语言列表

Unicode 需要ASCII编码完全支持的语言列表,unicode,ascii,Unicode,Ascii,我正在写一篇关于Unicode的文章,并讨论这种编码方案相对于像ASCII这样过时的方法的优势 作为我研究的一部分,我正在寻找一份参考文献,其中列出了仅使用ASCII支持的字符就可以完全表示的语言。我没有太多的运气在谷歌上找到它,我想我应该利用它的集体知识,看看是否有人有一个合理的名单 要点: 列出的所有语言必须能够 使用ASCII中可用的字符集完整地表示 我知道这不全面, 但我最感兴趣的是 最常见的书面语言 我想你指的是自然语言和7位ASCII码 在这种情况下,列表非常小。大部分是英语。鉴于

我正在写一篇关于Unicode的文章,并讨论这种编码方案相对于像ASCII这样过时的方法的优势

作为我研究的一部分,我正在寻找一份参考文献,其中列出了仅使用ASCII支持的字符就可以完全表示的语言。我没有太多的运气在谷歌上找到它,我想我应该利用它的集体知识,看看是否有人有一个合理的名单

要点:
  • 列出的所有语言必须能够 使用ASCII中可用的字符集完整地表示
  • 我知道这不全面, 但我最感兴趣的是 最常见的书面语言

    • 我想你指的是自然语言和7位ASCII码


      在这种情况下,列表非常小。大部分是英语。

      鉴于借词,我认为没有这样的语言。即使是丑陋的美国人也知道“简历”和“简历”之间的区别。

      据我所知,没有一种自然语言可以完全用ASCII表示。即使是美国英语,ASCII的发明语言,也不起作用:首先,有许多外来词已经融入美国英语语言中,无法用ASCII表示,比如resumé、naïve或每个程序员都经常使用的词schönfinkeln


      第二,ASCII缺少了几乎所有的排版字符,如“引号”、不同长度的破折号(–和-)、省略号(…)、窄空格和宽空格等,所有这些字符都在美式英语中使用。

      有些字符,如和,被设计为仅使用ASCII字符。”日常使用的真正语言倾向于使用ASCII范围以外的字符,至少对于外来词是这样。

      IIRC从我的拉丁语课程中,拉丁语中的长音符后来被学习拉丁诗中的米的人添加;他们不会在每天的写作中使用。所以你有了拉丁语。

      不是一种广泛使用的语言,但Rotokas只能用ASCII字母书写。请参见

      您是要求使用不允许使用Unicode字符的语言,还是不要求使用Unicode字符的语言?“完全代表”这句话意义不大。甚至APL也可以用纯ASCII编写。你能定义“完全表示”吗?你确定你说的是ASCII,而不是ISO-8859-1吗?ASCII即使对于英语也是不够的。让我用一个例子来提供一些上下文。假设您有一个将文本编码为纯旧式8位ASCII的应用程序,就像他们在计算机科学课上教我们的那样。我正在寻找这个应用程序不太可能破坏的自然语言列表。没有简单的旧式8位ASCII这样的东西。ASCII一直是并且将永远是7位的。大多数语言可以通过特定的8位代码页合理地处理。多语言代码页(如850或ISO 8859)可以处理指定语言组之间的交换。8位代码页的256个字符限制不允许在所有语言组之间进行交换,也不允许使用超过256个字符的语言表示或许多印刷字形表示。这一点很好。我没有考虑过借词的可能性。是的,尽管要吹毛求疵,三个句号是输入省略号的公认标准形式。Unicode U+2026水平省略号是一个兼容字符,用于允许对作为单个字符的传统编码进行往返。谢谢,我不知道这一点。在德语中,这通常是不允许的,当然,尽管每个人都这样做。并不是每个人都像我一样痴迷,实际上他用所有的排版字符编写自己的键盘映射:-)我从来没有想到过拉丁语,但你是对的。也许OP应该指定活的语言。拉丁语,莫图亚语,非est。