Python webscraping美丽汤列表错误
嗨,我正在尝试从BGS钻孔扫描下载图像,其中有多个页面,例如 我设法下载了第一个示例的前两页,但当我到达最后一页时,我得到了这个错误。在此页面上,NextPage变量应为None,因为该标签不在网页上。现在我想继续下一个位置,我还没有添加,但我有一个URL的excel列表。代码基于此 回溯(最近一次呼叫最后一次): 文件“C:/Users/brentond/Documents/Python/Pdf BGS Scans.py”,第73行,在 NextPage=soup.select('a[title=“Next page”]')[0] 索引器:列表索引超出范围 从URL的excel列表下载BGS钻孔扫描Python webscraping美丽汤列表错误,python,html,beautifulsoup,Python,Html,Beautifulsoup,嗨,我正在尝试从BGS钻孔扫描下载图像,其中有多个页面,例如 我设法下载了第一个示例的前两页,但当我到达最后一页时,我得到了这个错误。在此页面上,NextPage变量应为None,因为该标签不在网页上。现在我想继续下一个位置,我还没有添加,但我有一个URL的excel列表。代码基于此 回溯(最近一次呼叫最后一次): 文件“C:/Users/brentond/Documents/Python/Pdf BGS Scans.py”,第73行,在 NextPage=soup.select('a[titl
如果不存在,则无法选择其第一个元素。您可以先使用
find
/find_all
验证元素的存在,或者使用try
/except
来说明索引器,并在错误情况下修改脚本行为。如果元素不存在,则无法选择其第一个元素。您可以先尝试使用find
/find_all
验证元素的存在,也可以使用try
/except
来说明索引器,并在错误情况下修改脚本行为。因此,因为锚不存在汤。选择('a[title=“Next page”]”)
将始终返回空列表。因此,键0将不存在,因此引发索引器
这是最容易改变的事情
NextPage = soup.select('a[title="Next page"]')[0]
if NextPage ==[]:
continue
else:
print(NextPage)
NextURL = NextPage.get('href')
到
或
根据您的个人喜好因此,由于锚不存在,
汤。选择('a[title=“Next page”]”)
将始终返回空列表。因此,键0将不存在,因此引发索引器
这是最容易改变的事情
NextPage = soup.select('a[title="Next page"]')[0]
if NextPage ==[]:
continue
else:
print(NextPage)
NextURL = NextPage.get('href')
到
或
取决于你的个人喜好
NextPage = soup.select('a[title="Next page"]')
if not NextPage:
continue
else:
NextPage = NextPage[0]
print(NextPage)
NextURL = NextPage.get('href')
NextPage = soup.select('a[title="Next page"]')
if not NextPage:
continue
else:
print(NextPage[0])
NextURL = NextPage[0].get('href')