Regex 用于忽略主机名的正则表达式

Regex 用于忽略主机名的正则表达式,regex,Regex,我试图忽略网址的主机名部分,只保留路径 例如: http://bar.foooo.com/path1/path2/path3 目前我有以下正则表达式: \\bhttp\\b)*(\\bhttps\\b)*(\\b[\\w']{1,2}\\b)*(\\bwww\\b)*(\\bco\\b)*(\\buk\\b)*(\\bcom\\b)*(\\borg\\b)*[^\\p{L}\\p{N}]+|[\\w\\d']{20,}|\\b\\w*\\d\\w*", " ")); 这将链接转到: bar

我试图忽略网址的主机名部分,只保留路径

例如:

http://bar.foooo.com/path1/path2/path3
目前我有以下正则表达式:

\\bhttp\\b)*(\\bhttps\\b)*(\\b[\\w']{1,2}\\b)*(\\bwww\\b)*(\\bco\\b)*(\\buk\\b)*(\\bcom\\b)*(\\borg\\b)*[^\\p{L}\\p{N}]+|[\\w\\d']{20,}|\\b\\w*\\d\\w*", " "));
这将链接转到:

bar foooo path1 path2 path3

但我也想排除bar和Fooo,换句话说,忽略[http://bar.foooo.com/]

您可以使用以下表达式:

^https?:\/\/[^\/]\/(.*)$
它将忽略起始(或),并且只返回路径

^https?:\/\/[^\/]+\/(.+)$

应该有效。

它需要一个额外的量词^https?:\/\/[^\/]+?\/(.*)$您的正则表达式格式不正确,您应该指定使用的语言。