Python webscraping美丽汤列表错误_Python_Html_Beautifulsoup

Python webscraping美丽汤列表错误

python html

Python webscraping美丽汤列表错误,python,html,beautifulsoup,Python,Html,Beautifulsoup,嗨，我正在尝试从BGS钻孔扫描下载图像，其中有多个页面，例如我设法下载了第一个示例的前两页，但当我到达最后一页时，我得到了这个错误。在此页面上，NextPage变量应为None，因为该标签不在网页上。现在我想继续下一个位置，我还没有添加，但我有一个URL的excel列表。代码基于此回溯（最近一次呼叫最后一次）：文件“C:/Users/brentond/Documents/Python/Pdf BGS Scans.py”，第73行，在 NextPage=soup.select（'a[titl

嗨，我正在尝试从BGS钻孔扫描下载图像，其中有多个页面，例如

我设法下载了第一个示例的前两页，但当我到达最后一页时，我得到了这个错误。在此页面上，NextPage变量应为None，因为该标签不在网页上。现在我想继续下一个位置，我还没有添加，但我有一个URL的excel列表。代码基于此

回溯（最近一次呼叫最后一次）：文件“C:/Users/brentond/Documents/Python/Pdf BGS Scans.py”，第73行，在 NextPage=soup.select（'a[title=“Next page”]'）[0] 索引器：列表索引超出范围

从URL的excel列表下载BGS钻孔扫描

如果不存在，则无法选择其第一个元素。您可以先使用

find

find_all

验证元素的存在，或者使用

try

except

来说明索引器，并在错误情况下修改脚本行为。

如果元素不存在，则无法选择其第一个元素。您可以先尝试使用

find

find_all

验证元素的存在，也可以使用

try

except

来说明索引器，并在错误情况下修改脚本行为。

因此，因为锚不存在

汤。选择（'a[title=“Next page”]”）

将始终返回空列表。因此，键0将不存在，因此引发索引器

这是最容易改变的事情

    NextPage = soup.select('a[title="Next page"]')[0]
    if NextPage ==[]:
        continue
    else:
        print(NextPage)
        NextURL = NextPage.get('href')

到

或

根据您的个人喜好

因此，由于锚不存在，

汤。选择（'a[title=“Next page”]”）

将始终返回空列表。因此，键0将不存在，因此引发索引器

这是最容易改变的事情

    NextPage = soup.select('a[title="Next page"]')[0]
    if NextPage ==[]:
        continue
    else:
        print(NextPage)
        NextURL = NextPage.get('href')

到

或

取决于你的个人喜好

    NextPage = soup.select('a[title="Next page"]')
    if not NextPage:
        continue
    else:
        NextPage = NextPage[0]
        print(NextPage)
        NextURL = NextPage.get('href')

    NextPage = soup.select('a[title="Next page"]')
    if not NextPage:
        continue
    else:
        print(NextPage[0])
        NextURL = NextPage[0].get('href')