Python 拆分数据帧并维护数据帧组完整性

Python 拆分数据帧并维护数据帧组完整性,python,group-by,Python,Group By,与之相关的人 我有一个非常大的数据帧(MasterDataFrame),它包含约180K个组,我希望将这些组拆分为5个较小的数据帧,并分别处理每个较小的数据帧。有人知道我有什么方法可以将其拆分为5个较小的数据帧,而不会意外地拆分/破坏主数据帧中任何组的完整性吗?换句话说,我希望5个较小的数据帧没有重叠组 提前感谢, 克里斯托斯 这就是我的数据集的外观: |======主数据集======| 姓名年龄雇主 汤姆12沃尔玛 尼克15迪斯尼 克里斯18沃尔玛 达伦19卡马特 纳特43 ESPN 哈里2

与之相关的人

我有一个非常大的数据帧(MasterDataFrame),它包含约180K个组,我希望将这些组拆分为5个较小的数据帧,并分别处理每个较小的数据帧。有人知道我有什么方法可以将其拆分为5个较小的数据帧,而不会意外地拆分/破坏主数据帧中任何组的完整性吗?换句话说,我希望5个较小的数据帧没有重叠组

提前感谢,

克里斯托斯

这就是我的数据集的外观: |======主数据集======| 姓名年龄雇主 汤姆12沃尔玛 尼克15迪斯尼 克里斯18沃尔玛 达伦19卡马特 纳特43 ESPN 哈里23沃尔玛 乌里尔24卡马特酒店 马特23迪斯尼 . . . . . . . . .

我需要能够分割我的数据集,以便保留上面MasterDataset中显示的组。将我的MasterDataset拆分成的较小组需要如下所示:

|=======子数据集1======| 姓名年龄雇主 汤姆12沃尔玛 克里斯18沃尔玛 哈里23沃尔玛 达伦19卡马特 乌里尔24卡马特酒店

|=======子数据集2======| 姓名年龄雇主 尼克15迪斯尼
马特23迪斯尼

我想你指的是带有“组”的行数 为此,iloc应该是完美的

df_1 = df.iloc[0:100000,:]
df_2 = df.iloc[100001:200000,:]
....