使用python3从html源代码获取列表

使用python3从html源代码获取列表,python,html,web-scraping,beautifulsoup,Python,Html,Web Scraping,Beautifulsoup,我正试图从https://www.worldometers.info/,例如 示例看起来像(~行号:700): 它确实会刮取文件,但之后我就不知道如何获取数据了。 我要找的列表用##注释#我需要这个列表。请帮忙。你可以为它写一个正则表达式 import requests as req import re resp = req.get("https://www.worldometers.info/coronavirus/country/spain/") p = re.compile(r"(?&l

我正试图从
https://www.worldometers.info/
,例如

示例看起来像(~行号:700):

它确实会刮取文件,但之后我就不知道如何获取数据了。
我要找的列表用
##注释#我需要这个列表
。请帮忙。

你可以为它写一个正则表达式

import requests as req
import re

resp = req.get("https://www.worldometers.info/coronavirus/country/spain/")
p = re.compile(r"(?<=name:\s'Cases')[\s\S]+?data:\s(\[.*?\])")
p.findall(resp.text)[0]
按请求导入请求
进口稀土
resp=req.get(“https://www.worldometers.info/coronavirus/country/spain/")

p=re.compile(r)(?哇-非常感谢亲爱的QHarr-这是压倒性的-非常感谢如此深入的解释和对所有读者和访问者的支持-谢谢你…这是杰出的。
#!/usr/bin/env python3
import requests as req
from bs4 import BeautifulSoup as bs

resp = req.get("https://www.worldometers.info/coronavirus/country/spain/")
soup = bs(resp.text, 'lxml')
scripts = soup.find_all("script")
for script in scripts:
  if "Cases" in script.series:
    print(script.name)
import requests as req
import re

resp = req.get("https://www.worldometers.info/coronavirus/country/spain/")
p = re.compile(r"(?<=name:\s'Cases')[\s\S]+?data:\s(\[.*?\])")
p.findall(resp.text)[0]