Python 获取src之间的链接

Python 获取src之间的链接,python,regex,Python,Regex,我这里有一个数据 <div class="main-details mt10"> <div class="container"> <div class="row"> <div class="col-lg-8 col-md-7" data-purpose="introduction"> <div class="slp-jwpl

我这里有一个数据

<div class="main-details mt10">
    <div class="container">
        <div class="row">
            <div class="col-lg-8 col-md-7" data-purpose="introduction">
                                    <div class="slp-jwplayer-communicator" data-fade-in="1"
                         data-playerhtml='            <iframe id="hh"
                    src="https://localhost/embed/video/E0cZc345xCVTXwT/?params%5Bvars%5D%5Bplaylist%5D%5B0%5D%5Bimage%5D=https%3A%2F%2Flocalhost.images.com%2Fckxit%2F750x422%2F469292_6c3e_5.jpg&params%5BtrackVideoPlay%5D=true"
                    width="100%"
                    height="100%"
                    frameborder="0" webkitallowfullscreen mozallowfullscreen allowfullscreen
                    style="background: black;">
            </iframe>
        '>
                        <div class="promo-asset-content stretchy-wrapper ud-courseimpressiontracker"
                             data-id="erew343423"
                             data-tracking-type="proms"
                            >
                            <div>
                                <img class="cth" src="https://lcoalhost/data/469292_6c3e_5.jpg"/>
                            </div>
                        </div>
                    </div>
                            </div>
            <div class="col-lg-4 col-md-5">
                <div class="row fxdc lf-wrap-md">
                    <div class="fxw-md -md db-xs">
                        <div class="right-top col-md-12 col-sm-6">

<div class="take-btn">
            <div class="price fxac">

                    </div>

            <a class="ct "
       data-requireLogin="true"
       data-les="button-enroll-b"
       data-padding="0"
       data-passDtCode="true"
       data-purpose="take-this"
       href="https://localhost/code=kKp5D213TWOo">
        Take </a>
但是,下面的代码将返回jwplayer中的所有内容以及结果之外的文本

data = re.search(r'jwplayer.*src=\"(.*?)\"', html, re.MULTILINE | re.DOTALL).group(1)
如果一切都在jwplayer之后,我怎么能让一切都在src=“和”之间呢

编辑 好的,我知道了。html解析器更适合处理此类问题(html)。但假设我只是好奇如何在regex中执行这样的操作,有人能帮我吗?这些信息很有用,谁知道我将来可能会在文本文件中遇到这样的问题呢。此外,即使我使用html解析器,我也需要传递一些正则表达式,不管发生什么。

只要在“*”之后添加一个“?”就可以了,这样就不会太贪婪了

r'jwplayer.*?src=\"(.*?)\"'

我建议您改用解析器。为什么要用正则表达式解析HTML?我只是想找到一个链接。这是从一个会话中得到的,前面两条评论的意思是,regex不是一个好办法。你应该读书。考虑使用or,但我也必须使用正则表达式来查找jwplayer和src,不是吗?
data = re.search(r'jwplayer.*src=\"(.*?)\"', html, re.MULTILINE | re.DOTALL).group(1)
r'jwplayer.*?src=\"(.*?)\"'