Python 获取src之间的链接
我这里有一个数据Python 获取src之间的链接,python,regex,Python,Regex,我这里有一个数据 <div class="main-details mt10"> <div class="container"> <div class="row"> <div class="col-lg-8 col-md-7" data-purpose="introduction"> <div class="slp-jwpl
<div class="main-details mt10">
<div class="container">
<div class="row">
<div class="col-lg-8 col-md-7" data-purpose="introduction">
<div class="slp-jwplayer-communicator" data-fade-in="1"
data-playerhtml=' <iframe id="hh"
src="https://localhost/embed/video/E0cZc345xCVTXwT/?params%5Bvars%5D%5Bplaylist%5D%5B0%5D%5Bimage%5D=https%3A%2F%2Flocalhost.images.com%2Fckxit%2F750x422%2F469292_6c3e_5.jpg¶ms%5BtrackVideoPlay%5D=true"
width="100%"
height="100%"
frameborder="0" webkitallowfullscreen mozallowfullscreen allowfullscreen
style="background: black;">
</iframe>
'>
<div class="promo-asset-content stretchy-wrapper ud-courseimpressiontracker"
data-id="erew343423"
data-tracking-type="proms"
>
<div>
<img class="cth" src="https://lcoalhost/data/469292_6c3e_5.jpg"/>
</div>
</div>
</div>
</div>
<div class="col-lg-4 col-md-5">
<div class="row fxdc lf-wrap-md">
<div class="fxw-md -md db-xs">
<div class="right-top col-md-12 col-sm-6">
<div class="take-btn">
<div class="price fxac">
</div>
<a class="ct "
data-requireLogin="true"
data-les="button-enroll-b"
data-padding="0"
data-passDtCode="true"
data-purpose="take-this"
href="https://localhost/code=kKp5D213TWOo">
Take </a>
但是,下面的代码将返回jwplayer中的所有内容以及结果之外的文本
data = re.search(r'jwplayer.*src=\"(.*?)\"', html, re.MULTILINE | re.DOTALL).group(1)
如果一切都在jwplayer之后,我怎么能让一切都在src=“和”之间呢
编辑
好的,我知道了。html解析器更适合处理此类问题(html)。但假设我只是好奇如何在regex中执行这样的操作,有人能帮我吗?这些信息很有用,谁知道我将来可能会在文本文件中遇到这样的问题呢。此外,即使我使用html解析器,我也需要传递一些正则表达式,不管发生什么。只要在“*”之后添加一个“?”就可以了,这样就不会太贪婪了
r'jwplayer.*?src=\"(.*?)\"'
我建议您改用解析器。为什么要用正则表达式解析HTML?我只是想找到一个链接。这是从一个会话中得到的,前面两条评论的意思是,regex不是一个好办法。你应该读书。考虑使用or,但我也必须使用正则表达式来查找jwplayer和src,不是吗?
data = re.search(r'jwplayer.*src=\"(.*?)\"', html, re.MULTILINE | re.DOTALL).group(1)
r'jwplayer.*?src=\"(.*?)\"'