Python 如何使用BeautifulSoup获取特定数据
我不确定如何从中获得具体结果:Python 如何使用BeautifulSoup获取特定数据,python,python-3.x,beautifulsoup,Python,Python 3.x,Beautifulsoup,我不确定如何从中获得具体结果: <div class="videoPlayer"> <div class="border-radius-player"> <div id="allplayers" style="position:relative;width:100%;height:100%;overflow: hidden;"> <div id="box"> <d
<div class="videoPlayer">
<div class="border-radius-player">
<div id="allplayers" style="position:relative;width:100%;height:100%;overflow: hidden;">
<div id="box">
<div id="player_content" class="todo" style="text-align: center; display: block;">
<div id="player" class="jwplayer jew-reset jew-skin-seven jw-state-paused jw-flag-user-inactive" tabindex="0">
<div class="jw-media jw-reset">
<video class="jw-video jw-reset" x-webkit-playsinline="" src="https:EXAMPLE-URL-HERE" preload="metadata"></video>
</div">
它返回部分内容,但不返回到
视频类
请求。它是一个简单的html客户端,不能执行javascripts
不过,您还有三个选择要尝试
请求只下载静态网页,无法处理javascript代码。你能在b中做一个简单的字符串搜索,以确保你需要的元素存在于html代码中吗?它不存在,它会进入
框
,但我认为BeautifulSoup能够处理这个问题。尝试查找汤中的视频类。选择(“div.videoPlayer video.jw video.jw reset”):打印(video\u class.attrs['src'])
import urllib.request
from bs4 import BeautifulSoup
url = "https://someurlhere"
a = urllib.request.Request(url, headers={'User-Agent' : "Cliqz"})
b = urllib.request.urlopen(a) # prevent "Permission denies"
soup = BeautifulSoup(b, 'html.parser')
for video_class in soup.select("div.videoPlayer"):
print(video_class.text)