python中使用字典的数据挖掘

python中使用字典的数据挖掘,python,csv,dictionary,Python,Csv,Dictionary,打开(用户输入文件名,“r”)作为数据文件: header=data\u file.readline() 原始数据=数据文件.readlines() 对于原始数据中的元素: element=element.strip() 有用的_数据。追加(元素) data_file.close()为此,您最好使用Pandas库。它将开箱即用地解决这个问题以及未来的许多其他问题 for element in useful_data: year = element[0:4] month = el

打开(用户输入文件名,“r”)作为数据文件: header=data\u file.readline() 原始数据=数据文件.readlines() 对于原始数据中的元素: element=element.strip() 有用的_数据。追加(元素)


data_file.close()

为此,您最好使用
Pandas
库。它将开箱即用地解决这个问题以及未来的许多其他问题

for element in useful_data: 
    year = element[0:4]
    month = element[5:7]
    date = element[8:10]
    trading_data = element[11:]

   try:
       main_dict[(int(year), int(month))].update({int(date):[trading_data]})
   except KeyError:
       main_dict[(int(year), int(month))] = {}
       main_dict[(int(year), int(month))].update({int(date):[trading_data]})

我注意到熊猫需要先安装。是否有一种不需要安装其他库的方法来解决此问题?我使用的是Python3.5,您没有将内部dict的copy写入主dict,您只将同一内部dict的ref写入主dict的所有键。当您压缩内部dict时,所有主dict键都会发生更改
for element in useful_data: 
    year = element[0:4]
    month = element[5:7]
    date = element[8:10]
    trading_data = element[11:]

   try:
       main_dict[(int(year), int(month))].update({int(date):[trading_data]})
   except KeyError:
       main_dict[(int(year), int(month))] = {}
       main_dict[(int(year), int(month))].update({int(date):[trading_data]})