Python正则表达式:无法在组中获取匹配项

Python正则表达式:无法在组中获取匹配项,python,regex,regex-group,Python,Regex,Regex Group,我正在使用以下正则表达式: <a\s*href\s*=\s*\\\s*"(.*?)\\.*?>(.*?)<\/a> 预期产出: 第一组: https://abc/asd/asd/ki.html 编辑: 输入字符串非常复杂,它可以有多个标记紧随其后: <a href=\"http://sewe518.lmweera.kolio.se:8001/dtr?jobid=6170286\" class=\"wfid_temp560484 link\" target=\"_

我正在使用以下正则表达式:

<a\s*href\s*=\s*\\\s*"(.*?)\\.*?>(.*?)<\/a>
预期产出:

第一组:

https://abc/asd/asd/ki.html
编辑:

输入字符串非常复杂,它可以有多个标记紧随其后:

<a href=\"http://sewe518.lmweera.kolio.se:8001/dtr?jobid=6170286\" class=\"wfid_temp560484 link\" target=\"_blank\" style=\"target-new: tab;\"  data-ajax=\"false\">scheduling_PFS</a></td><td class=\"wfid_temp560509 tablecell\" style=\"color:green\" align=\"left\" valign=\"middle\" colspan=\"1\" rowspan=\"1\" >13</td><td class=\"wfid_temp560531 tablecell\" style=\"color:brown\" align=\"left\" valign=\"middle\" colspan=\"1\" rowspan=\"1\" >
13
你能试试这个吗

<a.+(http.*://[]\w/.]+.\w+):*.*\>(\w+)<\/a>
你能试试这个吗

<a.+(http.*://[]\w/.]+.\w+):*.*\>(\w+)<\/a>

你能试试这个吗:
href=\\“(\S*)\\\”*>(.*)


你能试试这个吗:
href=\\“(\S*)\\”*>(.*)



根据您的判断,您已经在使用实际的HTML解析器了。正则表达式怎么了?为什么不让BeautifulSoup完成它的工作呢?@user2357112我的HTML使用的是氮气,例如:
氮气。$insert_在(“page”,“wfid_panel”,“job:6170286
这就是为什么BeautifulSoup不工作的原因。我猜氮气是某种Erlang库。你的规则似乎是错误的,因为你只有一个
试试:
(.*
@pl-94请看一下我共享的链接。似乎正则表达式是正确的。根据您的判断,您已经在使用一个实际的HTML解析器。正则表达式是怎么回事?为什么不让BeautifulSoup来完成它的工作呢?@user2357112我的HTML正在使用氮气,例如:
氮气。$insert_在(“page”,“.wfid_panel”,“作业:6170286
这就是BeautifulSoup不工作的原因。我猜氮是某种Erlang库。您的规则似乎错误,因为您只有一个
请尝试:
(*?)
@pl-94请看一下我共享的链接。正则表达式似乎是正确的。如果不起作用,请尝试以下输入字符串:
谢谢您的时间!!但是输入比我前面提到的要复杂一些。您的正则表达式不适用于此类输入。请参阅编辑。这没有提供问题的答案。要e或要求作者澄清,在他们的帖子下方留下评论-你可以随时在自己的帖子上发表评论,一旦你有足够的评论,你就可以发表。-@Zulan:​​​​​​​​​​​​​​​这个答案怎么应该是一个注释?@KevinGuan问号和缺乏解释使它看起来更像一个注释而不是答案。请添加一些解释。传授基本逻辑比仅仅给出代码更重要,因为它可以帮助OP和其他读者自己解决此问题和类似问题。不起作用,try此输入字符串:
谢谢您的时间!!但输入比我前面提到的要复杂一些。您的正则表达式不适用于此类输入。请参阅编辑。这不会提供问题的答案。若要评论或要求作者澄清,请在其帖子下方留下评论-您可以随时对自己的po发表评论sts,一旦你有足够的时间,你就可以了。-@Zulan:​​​​​​​​​​​​​​​这个答案怎么应该是一个注释?@KevinGuan问号和缺乏解释使它看起来更像是一个注释而不是一个答案。请添加一些解释。传授基本逻辑比仅仅给出代码更重要,因为它可以帮助OP和其他读者自己解决这个问题和类似问题。问题是h您的初始模式是在匹配项中包含空格。请尝试将您的(.*)替换为(\S)(大写字母S),这样它只包含非白色的charsObjection;我没有看到该链接是字符串的演示。一般来说,“您能试试这个吗?”“表明您没有亲自测试该项。初始模式的问题是匹配项中包含空格。请尝试将您的(.*)替换为(\S)(大写S),以便它只包含非白色的charsObjection撤回;我没有看到该链接是字符串的演示。通常情况下,“您能试试这个吗?”表明您尚未亲自测试该项目。
<a.+(http.*://[]\w/.]+.\w+):*.*\>(\w+)<\/a>