Python 使用selenium/chromedriver在url的多个页面之间循环,并为url的每个页面下载html

Python 使用selenium/chromedriver在url的多个页面之间循环,并为url的每个页面下载html,python,for-loop,format,selenium-chromedriver,range,Python,For Loop,Format,Selenium Chromedriver,Range,我有一个博客网站,网站上有多页帖子。我需要循环浏览网站上的每个页面,下载每个页面的html代码并将其存储在列表中 我使用Chromedriver打开每个网站。到目前为止,我已经尝试使用range函数循环遍历总页数(16) 但是,当我运行这段代码时,它会在一个over上打开相同的页面并下载相同的html。我知道我需要在for循环中的某个地方指定(I),以便每次打开不同的页面,但我对chromedriver不太熟悉。我试着附加: driver.get('https://eller.arizona.e

我有一个博客网站,网站上有多页帖子。我需要循环浏览网站上的每个页面,下载每个页面的html代码并将其存储在列表中

我使用Chromedriver打开每个网站。到目前为止,我已经尝试使用range函数循环遍历总页数(16)

但是,当我运行这段代码时,它会在一个over上打开相同的页面并下载相同的html。我知道我需要在for循环中的某个地方指定(I),以便每次打开不同的页面,但我对chromedriver不太熟悉。我试着附加:

driver.get('https://eller.arizona.edu/departments-research/centers-labs/entrepreneurship/news-events/news?page=0').format(i)
但我得到了错误信息:

'NoneType' object has no attribute 'format'
当我使用requests.get时,我使用了类似的东西:

for i in range(15):
    url = "https://eller.arizona.edu/departments-research/centers-labs/entrepreneurship/news-events/news?page=0"
    reqs = requests.get(url)    

这对我来说很有效,但我想用chromedriver来做这件事。有没有想过如何从一个url循环浏览多个页面,并将html从url的每个页面下载到列表中


谢谢

您没有正确设置url的格式。应该是:

# add curly brackets as a placeholder for i
driver.get('https://eller.arizona.edu/departments-research/centers-labs/entrepreneurship/news-events/news?page={}').format(i)
这是我在页面间循环的代码:

from selenium import webdriver
import time
from selenium.webdriver.chrome.options import Options

chrome_options = Options()
chrome_options.add_argument('-start maximized')
driver = webdriver.Chrome(options=chrome_options)

for i in range(17):
    driver.get('https://eller.arizona.edu/departments-research/centers-labs/entrepreneurship/news-events/news?page={}'.format(i))
    time.sleep(2)
``

您没有正确设置url的格式。应该是:

# add curly brackets as a placeholder for i
driver.get('https://eller.arizona.edu/departments-research/centers-labs/entrepreneurship/news-events/news?page={}').format(i)
这是我在页面间循环的代码:

from selenium import webdriver
import time
from selenium.webdriver.chrome.options import Options

chrome_options = Options()
chrome_options.add_argument('-start maximized')
driver = webdriver.Chrome(options=chrome_options)

for i in range(17):
    driver.get('https://eller.arizona.edu/departments-research/centers-labs/entrepreneurship/news-events/news?page={}'.format(i))
    time.sleep(2)
``

嗨,蒂莫西,谢谢你的帮助。即使我尝试使用花括号作为I的占位符,我仍然得到一个“NoneType”对象没有属性“format”错误。你能在你的机器上复制我的代码吗?我更新了我的答案,加入了循环页面的代码。我测试了这个,它很有效。这对我很有效!谢谢你帮助我,我很感激。嗨,蒂莫西,谢谢你的帮助。即使我尝试使用花括号作为I的占位符,我仍然得到一个“NoneType”对象没有属性“format”错误。你能在你的机器上复制我的代码吗?我更新了我的答案,加入了循环页面的代码。我测试了这个,它很有效。这对我很有效!谢谢你努力帮助我,我很感激。