我想使用Python从网页中提取CSV文件。拉网_Python_Csv_Xlsx

我想使用Python从网页中提取CSV文件。拉网

python csv

我想使用Python从网页中提取CSV文件。拉网,python,csv,xlsx,Python,Csv,Xlsx,我想从此网页获取.csv文件或.xlsx文件。我曾想过使用webscraping和beautifulsoup，但这似乎效率低下。我想能够写一个函数，当这个网页被调用时，代码定位到CSV文件的链接，并将CSV文件返回给我这样我就可以对CSV文件进行分析有人能帮我吗这里有一个链接：使用urllib库获取网页的源代码这似乎有效： import urllib.request, urllib.error, urllib.parse url = 'https://data.london.gov.u

我想从此网页获取.csv文件或.xlsx文件。我曾想过使用webscraping和beautifulsoup，但这似乎效率低下。我想能够写一个函数，当这个网页被调用时，代码定位到CSV文件的链接，并将CSV文件返回给我

这样我就可以对CSV文件进行分析

有人能帮我吗

这里有一个链接：

使用urllib库获取网页的源代码

这似乎有效：

import urllib.request, urllib.error, urllib.parse

url = 'https://data.london.gov.uk/dataset/recorded_crime_rates'
csvfile = r"C:\Tmp\CrimeRates.csv"

#open main page
response = urllib.request.urlopen(url)
webContent = response.read()
wc = str(webContent)

#get csv URL
i = wc.find(r"crime%20rates.csv")
i2 = wc.find("/download/recorded_crime_rates", i-200)
csvURL = "https://data.london.gov.uk" + wc[i2:i+17]
print(csvURL)

#get csv
csvresp = urllib.request.urlopen(csvURL)
csvdata = str(csvresp.read())
print(len(csvdata), "bytes")

#save csv to file
print("Saving To", csvfile)
f = open(csvfile,"w")
f.write(csvdata.replace(r"\r\n","\n"))
f.close()

您可以搜索包含“aria label=“Download crime rates.csv”的元素并获取href值吗？然后在地址前面加上“”前缀。然后你会得到“谢谢你！Legend请确认此答案，以便将帖子从“无答案”列表中删除。谢谢。