Parsing 每个url段的有效字符?

Parsing 每个url段的有效字符?,parsing,http,url,ftp,uri,Parsing,Http,Url,Ftp,Uri,我目前正在寻找每个段的有效URL字符列表。 我所说的分段是指: Scheme Username Password Domain Port Path Querystring Fragment http :// user : pass @ foo.abcd.com : 80 / bla/index.htm ? abc=123&x=z # qwerty (我希望这能说明问题。)

我目前正在寻找每个段的有效URL字符列表。
我所说的分段是指:

Scheme     Username   Password       Domain       Port        Path          Querystring     Fragment
 http  ://   user   :   pass   @  foo.abcd.com  :  80  /  bla/index.htm  ?  abc=123&x=z  #   qwerty
(我希望这能说明问题。)

如果您想知道,我需要这些信息来编写一个非常高效的URL解析器

编辑:
我想我还需要知道每个段的起始字符和结束字符的规则。

查阅规范如何?参见IETF官方网站上的规范是(HTML版本)。Remy:(a)tools.IETF.org不是IETF官方网站;官方的RFC是(对纯文本感兴趣:-),(b)也就是说,我发布的URI中的HTML与“实际”规范相匹配。(a)(b)就我个人而言,我更喜欢直接使用来自ietf.org域的RFC URL,仅此而已。