Python 如何在函数列表中迭代不同的数据帧?
我是python的初学者,试图找到完成以下任务的最佳方法时,我正在发疯: 我有一个很大的数据集,其中的每一个观察都指向不同的品牌。在此数据集上,我之前创建了一些列,这些列对执行某些函数很有用 我创建了一些创建表的函数,然后这些表将包含在excel文件中。我必须为每一个数据帧做这件事,为品牌划分 我试图构建一个功能列表和一个我需要为其创建excel文件的选定品牌列表。但当我想用一个循环来做这件事时,我就迷路了 创建需要插入excel文件中的表的函数 我想创建一个循环,其中: 1) 从通用数据集中选择品牌,获得品牌的单个数据帧; 2) 对于每个分离的数据集,执行函数并创建相应的excel文件Python 如何在函数列表中迭代不同的数据帧?,python,pandas,dataframe,Python,Pandas,Dataframe,我是python的初学者,试图找到完成以下任务的最佳方法时,我正在发疯: 我有一个很大的数据集,其中的每一个观察都指向不同的品牌。在此数据集上,我之前创建了一些列,这些列对执行某些函数很有用 我创建了一些创建表的函数,然后这些表将包含在excel文件中。我必须为每一个数据帧做这件事,为品牌划分 我试图构建一个功能列表和一个我需要为其创建excel文件的选定品牌列表。但当我想用一个循环来做这件事时,我就迷路了 创建需要插入excel文件中的表的函数 我想创建一个循环,其中: 1) 从通用数据集中选
你的df有多大?整个df适合内存吗?我的df有20000个OB和101列,但内存不是问题。我的问题是创建嵌套循环来应用函数如果您尝试,我可以帮助您修复它的select_brand=[1,28,97110,60,40,90,30,31,32,33,34,35,36,37,38,39,80,41100,42,96,62,63],在select_brand:sub_df=df_MHT_communication[df_MHT_communication['M_brand']==r]中为r选择r_brand:sub_df.apply(lambda x:tab_new_born(x))
def tab_new_born(df):
tab_1 = df_cliente.astype(str).groupby('definitive_class').agg({'definitive_class': lambda x: x.count()})
return tab_1
def tab_updated_and_working(df):
tab_2 = pd.crosstab((df_cliente.FIRMWARE_STATUS_UPDATE == 'updated'), (df_cliente.app_trans_features == 1), margins = True)
tab_2.rename(index = {False : 'no', True : 'yes', 'All' : 'Total'},
columns = {False : 'no_trans_in_7_last_days', True : 'yes_trans_in_7_last_days','All' : 'Total' }, inplace= True)
return tab_2
#file excel
output = '_output.xlsx'
writer = pd.ExcelWriter(output, engine='xlsxwriter')
tab_new_born(df).to_excel(writer, sheet_name= 'MHT_classification')
tab_updated_and_working(df).to_excel(writer,sheet_name = '#VM_operative')
tab_working_and_anomalous(df).to_excel(writer,sheet_name = '#VM_conn_problems_operative')
tab_working_and_registry(df).to_excel(writer,sheet_name = '#VM_registry_null')
workbook = writer.book
writer.save()
workbook.close()