Python pd.read_excel only文件,其中文件名在过去5天内包含子字符串
我正试图从一个目录中读取一些excel文件来附加它们。我试过几次,但都没能成功。当我第一次附加整个目录时,我的内存崩溃了 基本上,我有一个包含.xlsx文件的目录,比如:H:\这里的数据是+300个文件,具有类似的文件名,如:files.01-01-2020\u amsterdam.xlsx我只想导入过去5天中的5个文件。我想到了:Python pd.read_excel only文件,其中文件名在过去5天内包含子字符串,python,pandas,loops,filenames,Python,Pandas,Loops,Filenames,我正试图从一个目录中读取一些excel文件来附加它们。我试过几次,但都没能成功。当我第一次附加整个目录时,我的内存崩溃了 基本上,我有一个包含.xlsx文件的目录,比如:H:\这里的数据是+300个文件,具有类似的文件名,如:files.01-01-2020\u amsterdam.xlsx我只想导入过去5天中的5个文件。我想到了: today = pd.datetime.now().date() today = today.strftime("%d-%m-%Y") 5day
today = pd.datetime.now().date()
today = today.strftime("%d-%m-%Y")
5days = today -5
如果我只需要一个文件,它就可以工作:
os.chdir('H:\data')
df = pd.read_excel("files." + today + "_amsterdam" +'.xlsx', sheet_name=0)
但是如何将5个文件放入一个df中?那么,如果日期部分介于今天和5天之间?我想是有一个循环,但我被卡住了。这行吗
另外,变量名不能以整数开头
import pandas as pd
import datetime
from datetime import date
import os
amountOfDays = 5
for i in range(amountOfDays):
dateOfDay = date.today() - datetime.timedelta(days=i)
dateOfDay = dateOfDay.strftime("%d-%m-%Y")
os.chdir('H:\data')
path = "files." + str(dateOfDay) + '_amsterdam' + '.xlsx'
if i == 0:
df = pd.read_excel(path, sheet_name=0)
else:
df = df.append(pd.read_excel(path, sheet_name=0),ignore_index=True)