Sampling A/B测试排序算法

Sampling A/B测试排序算法,sampling,ab-testing,Sampling,Ab Testing,我想做一个算法,使A/B测试能够在不同数量的科目上进行,每个科目具有不同数量的属性 例如,我有1000人拥有以下财产:他们来自两个部门,一些是经理,一些是女性等。这些财产可能会根据情况增加/减少 我想做一个算法,将人口一分为二,在所有属性的A和B中都有可能的最佳表示。所以我想要两组500人,两个部门人数相同,经理人数相同,女性人数相同。更具体地说,我想保持A和B中每个物业的比例。因此,如果我们有10%的经理,我希望样本A和样本B中的10%成为经理 有关于从哪里开始的建议吗?我很肯定这种算法是存在

我想做一个算法,使A/B测试能够在不同数量的科目上进行,每个科目具有不同数量的属性

例如,我有1000人拥有以下财产:他们来自两个部门,一些是经理,一些是女性等。这些财产可能会根据情况增加/减少

我想做一个算法,将人口一分为二,在所有属性的A和B中都有可能的最佳表示。所以我想要两组500人,两个部门人数相同,经理人数相同,女性人数相同。更具体地说,我想保持A和B中每个物业的比例。因此,如果我们有10%的经理,我希望样本A和样本B中的10%成为经理


有关于从哪里开始的建议吗?我很肯定这种算法是存在的。我有一种直觉,这在某些情况下可能无法解决,因为可能会有奇数的经理和女性以及第一部门。

列出所有a/b变量的排列

 Dept1,Manager,Male
 Dept1,Manager,Female
 Dept1,Junior,Male
 ...
 Dept2,Junior,Female
遍历所有人,并将他们分配到各自的排列中。也许先将人们的顺序随机化,只是为了确保他们添加到每个排列中的顺序没有偏差

 Dept1,Manager,Male-> Person1, Person16, Person143...
 Dept1,Manager,Female-> Person7, Person10, Person83...

有第二个过程,通过每个排列,将一半的人分配给一个测试组,另一半分配给另一个测试组。你需要考虑小组中的奇数人,但这应该很容易考虑进去,显然,更大的样本量将减少这个奇数对最终结果的影响。

分组的算法很简单——选取所有维度都相同的每组人,将一半分配给治疗组,一半分配给对照组。你不必担心奇数的人,无论你使用什么统计测试都可以解释这一点。如果某个维度如此倾斜(即,在整个样本中只有2个女性),那么将该维度剔除可能是明智的

简单的A/B测试通常使用t测试或g测试,但在您的情况下,最好使用A/B测试来确定每个维度上治疗的重要性