Python 熊猫读取多个文件
循环浏览一堆文件并为每个文件创建单独的数据帧的最佳方法是什么?我已经研究了其他问题,但似乎每个问题的重点都是将文件连接到一个数据帧中 例如,如果我有mylist=['a.csv'、'b.csv'、'c.csv'],并且我希望我的每个数据帧都采用文件名(a、b、c),我就不能这样做,因为赋值语句的左侧被视为字符串。如何更正此错误,以便将其解释为数据帧分配Python 熊猫读取多个文件,python,pandas,Python,Pandas,循环浏览一堆文件并为每个文件创建单独的数据帧的最佳方法是什么?我已经研究了其他问题,但似乎每个问题的重点都是将文件连接到一个数据帧中 例如,如果我有mylist=['a.csv'、'b.csv'、'c.csv'],并且我希望我的每个数据帧都采用文件名(a、b、c),我就不能这样做,因为赋值语句的左侧被视为字符串。如何更正此错误,以便将其解释为数据帧分配 mylist = ['a.csv','b.csv','c.csv'] import pandas as pd for file in mylis
mylist = ['a.csv','b.csv','c.csv']
import pandas as pd
for file in mylist:
file.rsplit('.csv',1)[0] = pd.read_csv(file)
使用字典理解:
dfs = {f.rsplit('.csv',1)[0]: pd.read_csv(file)
for f in mylist}
使用字典理解:
dfs = {f.rsplit('.csv',1)[0]: pd.read_csv(file)
for f in mylist}
我认为您可以创建
数据帧的字典:
import pandas as pd
mylist = ['a.csv','b.csv','c.csv']
dfs = {}
for f in mylist:
dfs.update({f.rsplit('.csv',1)[0]: pd.read_csv(f)})
print dfs['a']
我认为您可以创建数据帧的字典:
import pandas as pd
mylist = ['a.csv','b.csv','c.csv']
dfs = {}
for f in mylist:
dfs.update({f.rsplit('.csv',1)[0]: pd.read_csv(f)})
print dfs['a']
通常认为使用公式命名变量是不好的做法。更好的解决方案是使用字典:
mylist = ['a.csv','b.csv','c.csv']
mydict = {}
import pandas as pd
for file in mylist:
mydict[file.rsplit('.csv',1)[0]] = pd.read_csv(file)
完成此操作后,您可以通过以下方式访问每个数据帧:
mydict['a']
mydict['b']
等等。使用公式命名变量通常被认为是不好的做法。更好的解决方案是使用字典:
mylist = ['a.csv','b.csv','c.csv']
mydict = {}
import pandas as pd
for file in mylist:
mydict[file.rsplit('.csv',1)[0]] = pd.read_csv(file)
完成此操作后,您可以通过以下方式访问每个数据帧:
mydict['a']
mydict['b']
等等