Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/fsharp/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 如何在函数列表中迭代不同的数据帧?_Python_Pandas_Dataframe - Fatal编程技术网

Python 如何在函数列表中迭代不同的数据帧?

Python 如何在函数列表中迭代不同的数据帧?,python,pandas,dataframe,Python,Pandas,Dataframe,我是python的初学者,试图找到完成以下任务的最佳方法时,我正在发疯: 我有一个很大的数据集,其中的每一个观察都指向不同的品牌。在此数据集上,我之前创建了一些列,这些列对执行某些函数很有用 我创建了一些创建表的函数,然后这些表将包含在excel文件中。我必须为每一个数据帧做这件事,为品牌划分 我试图构建一个功能列表和一个我需要为其创建excel文件的选定品牌列表。但当我想用一个循环来做这件事时,我就迷路了 创建需要插入excel文件中的表的函数 我想创建一个循环,其中: 1) 从通用数据集中选

我是python的初学者,试图找到完成以下任务的最佳方法时,我正在发疯:

我有一个很大的数据集,其中的每一个观察都指向不同的品牌。在此数据集上,我之前创建了一些列,这些列对执行某些函数很有用

我创建了一些创建表的函数,然后这些表将包含在excel文件中。我必须为每一个数据帧做这件事,为品牌划分

我试图构建一个功能列表和一个我需要为其创建excel文件的选定品牌列表。但当我想用一个循环来做这件事时,我就迷路了

创建需要插入excel文件中的表的函数 我想创建一个循环,其中: 1) 从通用数据集中选择品牌,获得品牌的单个数据帧; 2) 对于每个分离的数据集,执行函数并创建相应的excel文件

  • 阅读全文
  • 从完整df中获得独特品牌(参见独特)
  • 循环浏览品牌
  • 对于每个品牌过滤器/从与当前品牌对应的完整df行中选择,并创建一个子df
  • 在sub_df上应用您的函数

  • 你的df有多大?整个df适合内存吗?我的df有20000个OB和101列,但内存不是问题。我的问题是创建嵌套循环来应用函数如果您尝试,我可以帮助您修复它的select_brand=[1,28,97110,60,40,90,30,31,32,33,34,35,36,37,38,39,80,41100,42,96,62,63],在select_brand:sub_df=df_MHT_communication[df_MHT_communication['M_brand']==r]中为r选择r_brand:sub_df.apply(lambda x:tab_new_born(x))
    def tab_new_born(df):
        tab_1 = df_cliente.astype(str).groupby('definitive_class').agg({'definitive_class': lambda x: x.count()})
        return tab_1
    
    def tab_updated_and_working(df):
        tab_2 =  pd.crosstab((df_cliente.FIRMWARE_STATUS_UPDATE == 'updated'), (df_cliente.app_trans_features == 1), margins = True)
        tab_2.rename(index = {False : 'no', True : 'yes', 'All' : 'Total'}, 
                 columns = {False : 'no_trans_in_7_last_days', True : 'yes_trans_in_7_last_days','All' : 'Total' }, inplace= True)
        return tab_2  
    
    #file excel
    output =  '_output.xlsx'
    writer = pd.ExcelWriter(output, engine='xlsxwriter')
    
    
    tab_new_born(df).to_excel(writer, sheet_name= 'MHT_classification')
    tab_updated_and_working(df).to_excel(writer,sheet_name = '#VM_operative')
    tab_working_and_anomalous(df).to_excel(writer,sheet_name = '#VM_conn_problems_operative')
    tab_working_and_registry(df).to_excel(writer,sheet_name = '#VM_registry_null')
    
    workbook = writer.book
    
    writer.save()
    workbook.close()