使用python3从html源代码获取列表_Python_Html_Web Scraping_Beautifulsoup

使用python3从html源代码获取列表

python html web-scraping

使用python3从html源代码获取列表,python,html,web-scraping,beautifulsoup,Python,Html,Web Scraping,Beautifulsoup,我正试图从https://www.worldometers.info/，例如示例看起来像（~行号：700）：它确实会刮取文件，但之后我就不知道如何获取数据了。我要找的列表用##注释#我需要这个列表。请帮忙。你可以为它写一个正则表达式 import requests as req import re resp = req.get("https://www.worldometers.info/coronavirus/country/spain/") p = re.compile(r"(?&l

我正试图从

https://www.worldometers.info/

，例如

示例看起来像（~行号：700）：

它确实会刮取文件，但之后我就不知道如何获取数据了。

我要找的列表用

##注释#我需要这个列表

。请帮忙。

你可以为它写一个正则表达式

import requests as req
import re

resp = req.get("https://www.worldometers.info/coronavirus/country/spain/")
p = re.compile(r"(?<=name:\s'Cases')[\s\S]+?data:\s(\[.*?\])")
p.findall(resp.text)[0]

按请求导入请求
进口稀土
resp=req.get（“https://www.worldometers.info/coronavirus/country/spain/")
p=re.compile（r）（？哇-非常感谢亲爱的QHarr-这是压倒性的-非常感谢如此深入的解释和对所有读者和访问者的支持-谢谢你…这是杰出的。
#!/usr/bin/env python3
import requests as req
from bs4 import BeautifulSoup as bs

resp = req.get("https://www.worldometers.info/coronavirus/country/spain/")
soup = bs(resp.text, 'lxml')
scripts = soup.find_all("script")
for script in scripts:
  if "Cases" in script.series:
    print(script.name)

import requests as req
import re

resp = req.get("https://www.worldometers.info/coronavirus/country/spain/")
p = re.compile(r"(?<=name:\s'Cases')[\s\S]+?data:\s(\[.*?\])")
p.findall(resp.text)[0]