Python 将相同结果打印两次_Python_Beautifulsoup

Python 将相同结果打印两次

python

Python 将相同结果打印两次,python,beautifulsoup,Python,Beautifulsoup,我试图浏览“比特币讨论板”上的所有页面，并打印每页的主题名称。它正在工作，但出于某种原因，它会在浏览不同的页面时连续打印两次主题名称。例如： URL（首页）：将打印其实际内容： ABC123 另一个话题然后。。。即使URL更改为第二页，它仍然会打印相同的主题然后所有其他页面都会发生同样的情况。每个页面打印两次（即使URL正在更改）有什么想法吗？这是我第一次体验Python和BeautifulSoup。不同页面的链接如下所示，即它们以.40为增量： URL = "https:/

我试图浏览“比特币讨论板”上的所有页面，并打印每页的主题名称。它正在工作，但出于某种原因，它会在浏览不同的页面时连续打印两次主题名称。例如：

URL（首页）：

将打印其实际内容：

ABC123

另一个话题

然后。。。即使URL更改为第二页，它仍然会打印相同的主题

然后所有其他页面都会发生同样的情况。每个页面打印两次（即使URL正在更改）

有什么想法吗？这是我第一次体验Python和BeautifulSoup。

不同页面的链接如下所示，即它们以

.40

为增量：

URL = "https://bitcointalk.org/index.php?board=1.0"
page = requests.get(URL)
soup = BeautifulSoup(page.content, 'html.parser')
numberOfPages = 0
currentPage = 0
counter = 1

for blabla in soup.find_all("a" , attrs={"class" : "navPages"})[-2]:  
    numberOfPages = int(blabla.string)
    print("Pages count: " + str(numberOfPages))
  

for i in range(0,numberOfPages):
    URLX = "https://bitcointalk.org/index.php?board=1."+ str(currentPage)
    print(URLX)
    print("------------------------------------------------- Page count is: " + str(counter))
    counter += 1
    currentPage += 20
    page1 = requests.get(URLX)
    soup1 = BeautifulSoup(page1.content, 'html.parser')   
    time.sleep(1.0)
    for random in soup1.find_all("span", attrs={"id": re.compile("^msg")}):
        for b in random.find_all('a', href=True):
            print (b.string)

因此，它应该是

currentPage+=40

，而不是当前

currentPage+=20

https://bitcointalk.org/index.php?board=1.0
https://bitcointalk.org/index.php?board=1.40
https://bitcointalk.org/index.php?board=1.80
https://bitcointalk.org/index.php?board=1.120