Warning: file_get_contents(/data/phpspider/zhask/data//catemap/5/url/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
从wiki文本中的链接确定确切的URL_Url_Wikipedia_Url Encoding_Mining - Fatal编程技术网

从wiki文本中的链接确定确切的URL

从wiki文本中的链接确定确切的URL,url,wikipedia,url-encoding,mining,Url,Wikipedia,Url Encoding,Mining,在维基百科的文章文本中,可能会提到一个链接,如:[Category:abc],但确切的维基url会有后缀,如Category:abc 我可以从那里获得有关wiki用于从文本链接中获取url的所有规则的信息(例如,将空格转换为下划线、首字母大写、处理非ascii字符等)没有“等”,您已经提到了所有规则: 空格将转换为下划线 文章标题的第一个字母大写(名称空间的第一个字母也大写,如果有) 整个链接是 请注意,规则1和规则2不是强制性的:如果您创建自己的URL不遵循这些规则,Wikipedia仍将正确

在维基百科的文章文本中,可能会提到一个链接,如:[Category:abc],但确切的维基url会有后缀,如Category:abc
我可以从那里获得有关wiki用于从文本链接中获取url的所有规则的信息(例如,将空格转换为下划线、首字母大写、处理非ascii字符等)

没有“等”,您已经提到了所有规则:

  • 空格将转换为下划线
  • 文章标题的第一个字母大写(名称空间的第一个字母也大写,如果有)
  • 整个链接是
  • 请注意,规则1和规则2不是强制性的:如果您创建自己的URL不遵循这些规则,Wikipedia仍将正确显示页面

    如果包含名称空间别名(
    WP:WikiProject Computing
    Wikipedia:WikiProject\u Computing
    )和Wiki间链接(
    wikia:gameofthrones:Westeros
    → <代码>http://www.wikia.com/wiki/c:gameofthrones:Westeros)。

    大致如下:

    • 规范化命名空间,例如
      类别:
      -->
      类别:
    • 大写标题的第一个字母,例如
      Category:foo
      -->
      Category:foo
      。注意:这取决于wiki设置,例如,Wiktionary上的标题从不大写
    • 用下划线替换空格,例如
      Foo-bar
      -->
      Foo-bar
    • 使用PHP的标准函数
      urlencode()
      对所有常用字符进行百分比编码,以下字符除外:
      ;:@$*(),/
    有关完整的技术详细信息,您可以查找(函数getLocalUrl())和(函数wfUrlencode())