Python 将相同结果打印两次
我试图浏览“比特币讨论板”上的所有页面,并打印每页的主题名称。它正在工作,但出于某种原因,它会在浏览不同的页面时连续打印两次主题名称。例如: URL(首页): 将打印其实际内容: ABC123 另一个话题 然后。。。即使URL更改为第二页,它仍然会打印相同的主题 然后所有其他页面都会发生同样的情况。每个页面打印两次(即使URL正在更改)Python 将相同结果打印两次,python,beautifulsoup,Python,Beautifulsoup,我试图浏览“比特币讨论板”上的所有页面,并打印每页的主题名称。它正在工作,但出于某种原因,它会在浏览不同的页面时连续打印两次主题名称。例如: URL(首页): 将打印其实际内容: ABC123 另一个话题 然后。。。即使URL更改为第二页,它仍然会打印相同的主题 然后所有其他页面都会发生同样的情况。每个页面打印两次(即使URL正在更改) 有什么想法吗?这是我第一次体验Python和BeautifulSoup。不同页面的链接如下所示,即它们以.40为增量: URL = "https:/
有什么想法吗?这是我第一次体验Python和BeautifulSoup。不同页面的链接如下所示,即它们以
.40
为增量:
URL = "https://bitcointalk.org/index.php?board=1.0"
page = requests.get(URL)
soup = BeautifulSoup(page.content, 'html.parser')
numberOfPages = 0
currentPage = 0
counter = 1
for blabla in soup.find_all("a" , attrs={"class" : "navPages"})[-2]:
numberOfPages = int(blabla.string)
print("Pages count: " + str(numberOfPages))
for i in range(0,numberOfPages):
URLX = "https://bitcointalk.org/index.php?board=1."+ str(currentPage)
print(URLX)
print("------------------------------------------------- Page count is: " + str(counter))
counter += 1
currentPage += 20
page1 = requests.get(URLX)
soup1 = BeautifulSoup(page1.content, 'html.parser')
time.sleep(1.0)
for random in soup1.find_all("span", attrs={"id": re.compile("^msg")}):
for b in random.find_all('a', href=True):
print (b.string)
因此,它应该是currentPage+=40
,而不是当前currentPage+=20
https://bitcointalk.org/index.php?board=1.0
https://bitcointalk.org/index.php?board=1.40
https://bitcointalk.org/index.php?board=1.80
https://bitcointalk.org/index.php?board=1.120