Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/277.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python Regex忽略单词并修复dble斜杠_Python_Regex - Fatal编程技术网

Python Regex忽略单词并修复dble斜杠

Python Regex忽略单词并修复dble斜杠,python,regex,Python,Regex,试图得到一个正则表达式,我需要它忽略一个特定的单词,但我的正则表达式不能正常工作 我们的忽略词将是“时间线”,并修复最后3行 事实上,我的正则表达式有时间线,但我不需要这个。 例如: https://www.example.com/test/timeline (actually) https://www.example.com/test (Perfect) 我有一个小错误,我不知道为什么最后三行没有正确地包含双斜杠 这是我的正则表达式: 如何忽略时间线并修复双斜杠?排除时间线 (?:https

试图得到一个正则表达式,我需要它忽略一个特定的单词,但我的正则表达式不能正常工作

我们的忽略词将是“时间线”,并修复最后3行

事实上,我的正则表达式有时间线,但我不需要这个。 例如:

https://www.example.com/test/timeline (actually)
https://www.example.com/test (Perfect)
我有一个小错误,我不知道为什么最后三行没有正确地包含双斜杠

这是我的正则表达式:

如何忽略时间线并修复双斜杠?

排除时间线

(?:https?:/)(?:www\)?facebook\.com/(?!(?:.+/)?[\w.-]*?时间线)(?:.+/)([\w.-]+)|%[^?/\r\n]*

断言将匹配时间线,如果它存在,当然会失败

您可以根据需要在时间线之前/之后添加特殊内容

还包括一些其他的修正

格式化

    (?: https?:// )?
    (?: www\. )?
    facebook\.com/
    (?!
         (?: .+ / )?
         [\w.-]*?
         timeline
    )
    (?: .+ / )?
    ( [\w.-]+ )                   # (1)
 |  
    % [^?/\r\n]* 
更新

直到单词
时间线
,但不能再继续

(?:https?:/)(?:www\)?facebook\.com/(?:.+/)(?:(?!timeline)[\w.-])+)|%[^?/\r\n]*


你在使用哪个正则表达式解析器?@OmegaMan,谢谢你的回答我在使用python。然后在以后的问题中把它放在标记行中。你能提供的信息越多越好。我正在看你的regex演示,不清楚你想匹配什么。你想跳过像
%?
这样的字符…@sln,我只需要删除单词“timeline”而不是完全排除url。如果忽略单词timeline,我接受你的解决方案。谢谢你的帮助@Spiro-Ok添加了它。
    (?: https?:// )?
    (?: www\. )?
    facebook\.com/
    (?: .+ / )?
    (                             # (1 start)
         (?:
              (?! timeline )
              [\w.-] 
         )+
    )                             # (1 end)
 |  
    % [^?/\r\n]*