Python “提取url链接”;只有";用“我的名字”;。php.com“;通过正则表达式

Python “提取url链接”;只有";用“我的名字”;。php.com“;通过正则表达式,python,regex,python-3.x,python-2.7,Python,Regex,Python 3.x,Python 2.7,试图通过正则表达式提取带有“.php.com”(即www.sample.php.com)的url链接“仅”,它无法提取并识别带有(.php.com)的特定url,如下代码所示。如果你有什么想法,请帮助我并给我建议。提前谢谢你 下面的代码能够提取http或https url,但不能仅使用php.com(即www.sample.php.com)准确地识别和提取url。我应该如何修改以下正则表达式以仅使用(php.com)提取url http[s]?:/(?:[a-zA-Z]|[0-9]|[$-|&+

试图通过正则表达式提取带有“.php.com”(即www.sample.php.com)的url链接“仅”,它无法提取并识别带有(.php.com)的特定url,如下代码所示。如果你有什么想法,请帮助我并给我建议。提前谢谢你

下面的代码能够提取http或https url,但不能仅使用php.com(即www.sample.php.com)准确地识别和提取url。我应该如何修改以下正则表达式以仅使用(php.com)提取url

http[s]?:/(?:[a-zA-Z]|[0-9]|[$-|&+]|[!*(),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+


仅使用php.com(www.sample.php.com)提取url,而不使用(www.sample.com或其他)

您可以添加一个肯定的前瞻,声明其中一个url组件是
php

http[s]?://(?=.*\bphp\.com\b)(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*(),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+
            ^^^ change is here

感谢您的快速回复。此外,还有学习正则表达式的有效方法吗。谢谢millions@IvanTo回答有关堆栈溢出的正则表达式问题。我甚至跟你开玩笑;它将迫使您前后学习整个regex API,并快速找到解决regex问题的方法。OP要求只匹配
php.com
,示例显示了
http://www.google.com.php
另外,如果我理解错误,请纠正我。谢谢