Pandas 将文件夹中的*随机*csv文件导入熊猫

Pandas 将文件夹中的*随机*csv文件导入熊猫,pandas,data-science,data-analysis,Pandas,Data Science,Data Analysis,我有一个包含多个csv文件的文件夹,文件名介于100和400之间(例如142.csv、278.csv等)。并非100-400之间的所有数字都与文件关联,例如,没有143.csv。我想写一个循环,将5个随机文件导入pandas中单独的数据帧,而不是反复手动搜索和键入文件名。有什么办法让我从这个开始吗 您可以使用glob读取目录中的所有csv文件 file = glob.glob('*.csv') random_files=np.random.choice(file,5) dataframes= [

我有一个包含多个csv文件的文件夹,文件名介于100和400之间(例如142.csv、278.csv等)。并非100-400之间的所有数字都与文件关联,例如,没有143.csv。我想写一个循环,将5个随机文件导入pandas中单独的数据帧,而不是反复手动搜索和键入文件名。有什么办法让我从这个开始吗

您可以使用glob读取目录中的所有csv文件

file = glob.glob('*.csv')
random_files=np.random.choice(file,5)
dataframes= []
for fp in random_files :
    dataframes.append(pd.read_csv(fp))
由此,您可以从目录中随机选择5个文件,然后分别读取它们。
希望我能回答您的问题

将所有文件名加载到一个数组中。从该数组中随机选择一个名称并加载?使用
files=
(files,5)
@QuangHoang,这就是我尝试过的,但无法找出导致我出现问题的简单语法错误。谢谢@克丽萨,我不熟悉glob,我会查的。谢谢你给我指明了正确的方向!