Python 如何使用beautifulsoup刮取网站
我正试图刮费领域的网站Python 如何使用beautifulsoup刮取网站,python,web-scraping,beautifulsoup,Python,Web Scraping,Beautifulsoup,我正试图刮费领域的网站 url = 'https://remittanceprices.worldbank.org/en/corridor/Australia/China' r = requests.get(url,verify=False) soup = BeautifulSoup(r.text,'lxml') rows = [i.get_text("|").split("|") for i in soup.select('#tab-1 .corrido
url = 'https://remittanceprices.worldbank.org/en/corridor/Australia/China'
r = requests.get(url,verify=False)
soup = BeautifulSoup(r.text,'lxml')
rows = [i.get_text("|").split("|") for i in soup.select('#tab-1 .corridor-row')]
for row in rows:
#a,b,c,d,e = row[2],row[15],row[18],row[21],row[25]
#print(a,b,c,d,e,sep='|')
print('{0[2]}|{0[15]}|{0[18]}|{0[21]}|{0[25]}').format(row)
但是我收到一个带有上述代码的AttributeError响应
有人能帮我吗?问题是您正在将
.format()
与print()
一起使用,而不是字符串.format()
是一种str
类型的方法,print()
实际上返回None
,因此请尝试:
url = 'https://remittanceprices.worldbank.org/en/corridor/Australia/China'
r = requests.get(url,verify=False)
soup = BeautifulSoup(r.text,'lxml')
rows = [i.get_text("|").split("|") for i in soup.select('#tab-1 .corridor-row')]
for row in rows:
#a,b,c,d,e = row[2],row[15],row[18],row[21],row[25]
#print(a,b,c,d,e,sep='|')
print('{0[2]}|{0[15]}|{0[18]}|{0[21]}|{0[25]}'.format(row))
谢谢。我想提取所有行的“费用”列值。我试着用上面的片段。你能告诉我怎么才能做到吗?