Python 如何使用beautifulsoup刮取网站_Python_Web Scraping_Beautifulsoup

Python 如何使用beautifulsoup刮取网站

python web-scraping

Python 如何使用beautifulsoup刮取网站,python,web-scraping,beautifulsoup,Python,Web Scraping,Beautifulsoup,我正试图刮费领域的网站 url = 'https://remittanceprices.worldbank.org/en/corridor/Australia/China' r = requests.get(url,verify=False) soup = BeautifulSoup(r.text,'lxml') rows = [i.get_text("|").split("|") for i in soup.select('#tab-1 .corrido

我正试图刮费领域的网站

url = 'https://remittanceprices.worldbank.org/en/corridor/Australia/China'
r = requests.get(url,verify=False)
soup = BeautifulSoup(r.text,'lxml')
rows = [i.get_text("|").split("|") for i in soup.select('#tab-1 .corridor-row')]
for row in rows:
    #a,b,c,d,e = row[2],row[15],row[18],row[21],row[25]
    #print(a,b,c,d,e,sep='|')
    print('{0[2]}|{0[15]}|{0[18]}|{0[21]}|{0[25]}').format(row)

但是我收到一个带有上述代码的AttributeError响应

有人能帮我吗？

问题是您正在将

.format（）

与

print（）

一起使用，而不是字符串

.format（）

是一种

str

类型的方法，

print（）

实际上返回

None

，因此请尝试：

url = 'https://remittanceprices.worldbank.org/en/corridor/Australia/China'
r = requests.get(url,verify=False)
soup = BeautifulSoup(r.text,'lxml')
rows = [i.get_text("|").split("|") for i in soup.select('#tab-1 .corridor-row')]
for row in rows:
    #a,b,c,d,e = row[2],row[15],row[18],row[21],row[25]
    #print(a,b,c,d,e,sep='|')
    print('{0[2]}|{0[15]}|{0[18]}|{0[21]}|{0[25]}'.format(row))

谢谢。我想提取所有行的“费用”列值。我试着用上面的片段。你能告诉我怎么才能做到吗？