Python Regex忽略单词并修复dble斜杠
试图得到一个正则表达式,我需要它忽略一个特定的单词,但我的正则表达式不能正常工作 我们的忽略词将是“时间线”,并修复最后3行 事实上,我的正则表达式有时间线,但我不需要这个。 例如:Python Regex忽略单词并修复dble斜杠,python,regex,Python,Regex,试图得到一个正则表达式,我需要它忽略一个特定的单词,但我的正则表达式不能正常工作 我们的忽略词将是“时间线”,并修复最后3行 事实上,我的正则表达式有时间线,但我不需要这个。 例如: https://www.example.com/test/timeline (actually) https://www.example.com/test (Perfect) 我有一个小错误,我不知道为什么最后三行没有正确地包含双斜杠 这是我的正则表达式: 如何忽略时间线并修复双斜杠?排除时间线 (?:https
https://www.example.com/test/timeline (actually)
https://www.example.com/test (Perfect)
我有一个小错误,我不知道为什么最后三行没有正确地包含双斜杠
这是我的正则表达式:
如何忽略时间线并修复双斜杠?排除时间线
(?:https?:/)(?:www\)?facebook\.com/(?!(?:.+/)?[\w.-]*?时间线)(?:.+/)([\w.-]+)|%[^?/\r\n]*
断言将匹配时间线,如果它存在,当然会失败
您可以根据需要在时间线之前/之后添加特殊内容
还包括一些其他的修正
格式化
(?: https?:// )?
(?: www\. )?
facebook\.com/
(?!
(?: .+ / )?
[\w.-]*?
timeline
)
(?: .+ / )?
( [\w.-]+ ) # (1)
|
% [^?/\r\n]*
更新
直到单词时间线
,但不能再继续
(?:https?:/)(?:www\)?facebook\.com/(?:.+/)(?:(?!timeline)[\w.-])+)|%[^?/\r\n]*
你在使用哪个正则表达式解析器?@OmegaMan,谢谢你的回答我在使用python。然后在以后的问题中把它放在标记行中。你能提供的信息越多越好。我正在看你的regex演示,不清楚你想匹配什么。你想跳过像
%?
这样的字符…@sln,我只需要删除单词“timeline”而不是完全排除url。如果忽略单词timeline,我接受你的解决方案。谢谢你的帮助@Spiro-Ok添加了它。
(?: https?:// )?
(?: www\. )?
facebook\.com/
(?: .+ / )?
( # (1 start)
(?:
(?! timeline )
[\w.-]
)+
) # (1 end)
|
% [^?/\r\n]*