Python 将数据反向聚合到可能的观测数据集中

Python 将数据反向聚合到可能的观测数据集中,python,dataset,aggregate,auto-generate,Python,Dataset,Aggregate,Auto Generate,是否可以生成一个二进制观测数据集,其中生成的数据集的比例对应于已知的聚合信息 例如,我有3个二元特征a、b、c,我知道总共应该有4个观察值,其中a存在,5个观察值,其中b存在,2个观察值,其中c存在 a=4 b=5 c=2 我还知道,在a&b存在的地方,应该有3个观察结果,在a&c存在的地方,应该有2个观察结果,在b&c存在的地方,应该有2个观察结果 a&b=3 a&c=2 b&c=2 最后,我知道总共应该有6次观察 n=6 仅给出此信息,对于具有100个特征的高维

是否可以生成一个二进制观测数据集,其中生成的数据集的比例对应于已知的聚合信息

例如,我有3个二元特征a、b、c,我知道总共应该有4个观察值,其中a存在,5个观察值,其中b存在,2个观察值,其中c存在

a=4
b=5
c=2
我还知道,在a&b存在的地方,应该有3个观察结果,在a&c存在的地方,应该有2个观察结果,在b&c存在的地方,应该有2个观察结果

a&b=3
a&c=2
b&c=2
最后,我知道总共应该有6次观察

n=6
仅给出此信息,对于具有100个特征的高维情况,是否可以生成符合此标准的数据集

    A B C
1   1 1 1
2   1 1 0
3   1 1 1
4   1 0 0
5   0 1 0
6   0 1 0