Python Regex忽略单词并修复dble斜杠_Python_Regex

Python Regex忽略单词并修复dble斜杠

python regex

Python Regex忽略单词并修复dble斜杠,python,regex,Python,Regex,试图得到一个正则表达式，我需要它忽略一个特定的单词，但我的正则表达式不能正常工作我们的忽略词将是“时间线”，并修复最后3行事实上，我的正则表达式有时间线，但我不需要这个。例如： https://www.example.com/test/timeline (actually) https://www.example.com/test (Perfect) 我有一个小错误，我不知道为什么最后三行没有正确地包含双斜杠这是我的正则表达式：如何忽略时间线并修复双斜杠？排除时间线（？：https

试图得到一个正则表达式，我需要它忽略一个特定的单词，但我的正则表达式不能正常工作

我们的忽略词将是“时间线”，并修复最后3行

事实上，我的正则表达式有时间线，但我不需要这个。例如：

https://www.example.com/test/timeline (actually)
https://www.example.com/test (Perfect)

我有一个小错误，我不知道为什么最后三行没有正确地包含双斜杠

这是我的正则表达式：

如何忽略时间线并修复双斜杠？

排除时间线

（？：https？：/）（？：www\）？facebook\.com/（？！（？：.+/）？[\w.-]*？时间线）（？：.+/）（[\w.-]+）|%[^？/\r\n]*

断言将匹配时间线，如果它存在，当然会失败

您可以根据需要在时间线之前/之后添加特殊内容

还包括一些其他的修正

格式化

    (?: https?:// )?
    (?: www\. )?
    facebook\.com/
    (?!
         (?: .+ / )?
         [\w.-]*?
         timeline
    )
    (?: .+ / )?
    ( [\w.-]+ )                   # (1)
 |  
    % [^?/\r\n]*

更新

直到单词

时间线

，但不能再继续

（？：https？：/）（？：www\）？facebook\.com/（？：.+/）（？：（？！timeline）[\w.-]）+）|%[^？/\r\n]*

你在使用哪个正则表达式解析器？@OmegaMan，谢谢你的回答我在使用python。然后在以后的问题中把它放在标记行中。你能提供的信息越多越好。我正在看你的regex演示，不清楚你想匹配什么。你想跳过像

%？

这样的字符…@sln，我只需要删除单词“timeline”而不是完全排除url。如果忽略单词timeline，我接受你的解决方案。谢谢你的帮助@Spiro-Ok添加了它。

    (?: https?:// )?
    (?: www\. )?
    facebook\.com/
    (?: .+ / )?
    (                             # (1 start)
         (?:
              (?! timeline )
              [\w.-] 
         )+
    )                             # (1 end)
 |  
    % [^?/\r\n]*