Url Unicode字符是否存在已知的URI方案或URN命名空间?

Url Unicode字符是否存在已知的URI方案或URN命名空间?,url,unicode,uri,semantic-web,urn,Url,Unicode,Uri,Semantic Web,Urn,我需要引用带有URI的Unicode字符。下面的IANA引用列出了多个方案和名称空间,但没有提到任何关于Unicode字符标识符的内容。有人知道这样的事情是否已经存在吗 我希望能找到像这样的东西 unicode://U+0394 urn:unicode://0394 http://unicode.org/unicode/0394 对于希腊文大写字母deltaΔ 若有人想知道,这是一个语义web类应用程序,它使用URI作为概念的标识符,包括Unicode字符的概念。恐怕并没有URL或U

我需要引用带有URI的Unicode字符。下面的IANA引用列出了多个方案和名称空间,但没有提到任何关于Unicode字符标识符的内容。有人知道这样的事情是否已经存在吗

我希望能找到像这样的东西

  • unicode://U+0394
  • urn:unicode://0394
  • http://unicode.org/unicode/0394
对于希腊文大写字母deltaΔ


若有人想知道,这是一个语义web类应用程序,它使用URI作为概念的标识符,包括Unicode字符的概念。

恐怕并没有URL或URN来引用一般Unicode字符的权威信息。在Unicode标准中,有关单个字符的信息部分位于所谓的字符数据库(主要是特定格式的纯文本文件)中,部分位于代码图(PDF文件)中。它们都没有提供一种指向单个角色的方法。此外,那里的信息并不详尽:标准中散布着关于单个字符信息的重要注释

该站点具有单独的可寻址项,例如

但是它的信息内容变化很大,而且通常非常有限。它不是官方的,目前只包含Unicode 5.0

这个网站更系统,但它也是非官方的。它基本上仅限于形式属性和可从中派生的数据,加上从代码图表中提取的注释,加上在Windows中键入字符的说明,再加上有关字体支持的信息,但这太多了!例如:


[EDIT]:发现此URL符合您的需要:

嗯,有一个URL引用Unicode数据库上的权威信息,尽管它没有描述(如另一个答案中所述)某个特定字符上的所有信息

您有以下URL,指向最新的Unicode数据库。这是现有有效Unicode字符的简单列表。一些即将出现的角色丢失了(㋿), 你应该期望它是可变的

内容如下所示,使用起来不太实际

$ grep -ai kangaroo UnicodeData.txt -C 7
1F991;SQUID;So;0;ON;;;;;N;;;;;
1F992;GIRAFFE FACE;So;0;ON;;;;;N;;;;;
1F993;ZEBRA FACE;So;0;ON;;;;;N;;;;;
1F994;HEDGEHOG;So;0;ON;;;;;N;;;;;
1F995;SAUROPOD;So;0;ON;;;;;N;;;;;
1F996;T-REX;So;0;ON;;;;;N;;;;;
1F997;CRICKET;So;0;ON;;;;;N;;;;;
1F998;KANGAROO;So;0;ON;;;;;N;;;;;
1F999;LLAMA;So;0;ON;;;;;N;;;;;
1F99A;PEACOCK;So;0;ON;;;;;N;;;;;
1F99B;HIPPOPOTAMUS;So;0;ON;;;;;N;;;;;
1F99C;PARROT;So;0;ON;;;;;N;;;;;
1F99D;RACCOON;So;0;ON;;;;;N;;;;;
1F99E;LOBSTER;So;0;ON;;;;;N;;;;;
1F99F;MOSQUITO;So;0;ON;;;;;N;;;;;
你可以用这样的后缀建立一个“基于散列”的hacky名称空间,但这绝对是非标准的

由于这也被标记,我将尝试选择易于(永久)取消引用并且不会被误认为描述该字符的文档的URI:the
data:
scheme。它不仅可以引用Unicode中的字符,还可以引用任何编码,以及其中的任何字符串

数据:;字符集=utf-8,%CE%94

试图打开此URI将导致一个
text/plain
文件,其内容为单个字符

如果系统接受IRIs(就像许多语义web应用程序一样),则可以直接包含字符:

数据:;字符集=utf-8,Δ

这映射到如上所示的同一URI,您的浏览器可以直接转换它。在这种情况下,指定UTF-8是必要的,因为没有为其他编码定义映射