Python中HTTP链接的文本处理

Python中HTTP链接的文本处理,python,Python,假设我有一个url http://www.google.com/subdomain/blah-blah.../.. /.. 所以我想从中提取4点 1) 协议:“http” 2) “www” 3) 域名:谷歌“ 4) “com”部分 5) 子域par:所有在.com之后的部分 但正如你所看到的,这个链接可以是任何东西 ftp://google.net/hola-hola 现在,这可能也是一个有效的链接。 那么,如何使用python提取url的这些不同部分呢 请参见urlparse

假设我有一个url

http://www.google.com/subdomain/blah-blah.../.. /..
所以我想从中提取4点 1) 协议:“http” 2) “www” 3) 域名:谷歌“ 4) “com”部分 5) 子域par:所有在.com之后的部分 但正如你所看到的,这个链接可以是任何东西

ftp://google.net/hola-hola
现在,这可能也是一个有效的链接。 那么,如何使用python提取url的这些不同部分呢

请参见urlparse