Python “提取url链接”；只有"；用“我的名字”；。php.com“；通过正则表达式_Python_Regex_Python 3.x_Python 2.7

Python “提取url链接”；只有"；用“我的名字”；。php.com“；通过正则表达式

python regex python-3.x python-2.7

Python “提取url链接”；只有"；用“我的名字”；。php.com“；通过正则表达式,python,regex,python-3.x,python-2.7,Python,Regex,Python 3.x,Python 2.7,试图通过正则表达式提取带有“.php.com”（即www.sample.php.com）的url链接“仅”，它无法提取并识别带有（.php.com）的特定url，如下代码所示。如果你有什么想法，请帮助我并给我建议。提前谢谢你下面的代码能够提取http或https url，但不能仅使用php.com（即www.sample.php.com）准确地识别和提取url。我应该如何修改以下正则表达式以仅使用（php.com）提取url http[s]？：/（？：[a-zA-Z]|[0-9]|[$-|&+

试图通过正则表达式提取带有“.php.com”（即www.sample.php.com）的url链接“仅”，它无法提取并识别带有（.php.com）的特定url，如下代码所示。如果你有什么想法，请帮助我并给我建议。提前谢谢你

下面的代码能够提取http或https url，但不能仅使用php.com（即www.sample.php.com）准确地识别和提取url。我应该如何修改以下正则表达式以仅使用（php.com）提取url

http[s]？：/（？：[a-zA-Z]|[0-9]|[$-|&+]|[！*（），]|（？：%[0-9a-fA-F][0-9a-fA-F]））+

仅使用php.com（www.sample.php.com）提取url，而不使用（www.sample.com或其他）

您可以添加一个肯定的前瞻，声明其中一个url组件是

php

：

http[s]?://(?=.*\bphp\.com\b)(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*(),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+
            ^^^ change is here

感谢您的快速回复。此外，还有学习正则表达式的有效方法吗。谢谢millions@IvanTo回答有关堆栈溢出的正则表达式问题。我甚至跟你开玩笑；它将迫使您前后学习整个regex API，并快速找到解决regex问题的方法。OP要求只匹配

php.com

，示例显示了

http://www.google.com.php

另外，如果我理解错误，请纠正我。谢谢