Python webscraping美丽汤列表错误

Python webscraping美丽汤列表错误,python,html,beautifulsoup,Python,Html,Beautifulsoup,嗨,我正在尝试从BGS钻孔扫描下载图像,其中有多个页面,例如 我设法下载了第一个示例的前两页,但当我到达最后一页时,我得到了这个错误。在此页面上,NextPage变量应为None,因为该标签不在网页上。现在我想继续下一个位置,我还没有添加,但我有一个URL的excel列表。代码基于此 回溯(最近一次呼叫最后一次): 文件“C:/Users/brentond/Documents/Python/Pdf BGS Scans.py”,第73行,在 NextPage=soup.select('a[titl

嗨,我正在尝试从BGS钻孔扫描下载图像,其中有多个页面,例如

我设法下载了第一个示例的前两页,但当我到达最后一页时,我得到了这个错误。在此页面上,NextPage变量应为None,因为该标签不在网页上。现在我想继续下一个位置,我还没有添加,但我有一个URL的excel列表。代码基于此

回溯(最近一次呼叫最后一次): 文件“C:/Users/brentond/Documents/Python/Pdf BGS Scans.py”,第73行,在 NextPage=soup.select('a[title=“Next page”]')[0] 索引器:列表索引超出范围

从URL的excel列表下载BGS钻孔扫描
如果不存在,则无法选择其第一个元素。您可以先使用
find
/
find_all
验证元素的存在,或者使用
try
/
except
来说明索引器,并在错误情况下修改脚本行为。

如果元素不存在,则无法选择其第一个元素。您可以先尝试使用
find
/
find_all
验证元素的存在,也可以使用
try
/
except
来说明索引器,并在错误情况下修改脚本行为。

因此,因为锚不存在
汤。选择('a[title=“Next page”]”)
将始终返回空列表。因此,键0将不存在,因此引发索引器

这是最容易改变的事情

    NextPage = soup.select('a[title="Next page"]')[0]
    if NextPage ==[]:
        continue
    else:
        print(NextPage)
        NextURL = NextPage.get('href')


根据您的个人喜好

因此,由于锚不存在,
汤。选择('a[title=“Next page”]”)
将始终返回空列表。因此,键0将不存在,因此引发索引器

这是最容易改变的事情

    NextPage = soup.select('a[title="Next page"]')[0]
    if NextPage ==[]:
        continue
    else:
        print(NextPage)
        NextURL = NextPage.get('href')

取决于你的个人喜好

    NextPage = soup.select('a[title="Next page"]')
    if not NextPage:
        continue
    else:
        NextPage = NextPage[0]
        print(NextPage)
        NextURL = NextPage.get('href')
    NextPage = soup.select('a[title="Next page"]')
    if not NextPage:
        continue
    else:
        print(NextPage[0])
        NextURL = NextPage[0].get('href')