如果维基百科在URL中使用中文字符(和其他unicode字符)是有效的

如果维基百科在URL中使用中文字符(和其他unicode字符)是有效的,url,encoding,Url,Encoding,在维基百科上,您可以看到如下URL: (但复制粘贴URL会产生相同的结果) (当粘贴副本时变为 ) 首先,我想知道这里发生了什么,编码转换被称为什么,它在做什么,为什么要这样做。我不明白为什么不能在URL中只包含原始的本地字符 其次,我想知道维基百科的做法是否被认为是有效的。如果可以在URL中包含这些非ASCII标志符号,如果不可以,为什么不可以(可能是因为标准这么说)。还想知道有多少浏览器支持在URL栏中使用本机标志符号和这种编码的东西来显示链接,甚至想知道本机中文/泰语/等等。如果人们使

在维基百科上,您可以看到如下URL:

  • (但复制粘贴URL会产生相同的结果)
  • (当粘贴副本时变为 )
首先,我想知道这里发生了什么,编码转换被称为什么,它在做什么,为什么要这样做。我不明白为什么不能在URL中只包含原始的本地字符

其次,我想知道维基百科的做法是否被认为是有效的。如果可以在URL中包含这些非ASCII标志符号,如果不可以,为什么不可以(可能是因为标准这么说)。还想知道有多少浏览器支持在URL栏中使用本机标志符号和这种编码的东西来显示链接,甚至想知道本机中文/泰语/等等。如果人们使用编码或什么,他们是如何用自己的语言输入URL的(但这可能会使这个问题变得太复杂;这仍然是一个有趣的奖励)

我问这个问题的原因是因为我想把几个不同语言的单词/定义放到一个网页上,我想让url显示该语言中实际使用的单词。所以在英语中可能是
/hello
,但在泰语中等效的单词/定义是
/สวัสดี。对我来说,这比把它编入编码的东西更有意义。

来自

URI中的数据八位字节字符串表示为字符。*URI中允许的字符是现代英语字母表中小写和大写字母的ASCII字符,阿拉伯数字、连字符、句点、下划线和波浪形。[14]任何其他字符表示的八位字节必须进行百分比编码


并非所有Unicode字符都可以在URI中使用。不受支持的字符仍然可以使用进行编码。您可以在URL字段中看到非ascii字符,因为您的浏览器选择以这种方式显示它们,实际的HTTP请求是使用编码的字符串完成的。

注意:通常使用UTF-8,然后使用%-编码。