Sampling A/B测试排序算法_Sampling_Ab Testing

Sampling A/B测试排序算法

Sampling A/B测试排序算法,sampling,ab-testing,Sampling,Ab Testing,我想做一个算法，使A/B测试能够在不同数量的科目上进行，每个科目具有不同数量的属性例如，我有1000人拥有以下财产：他们来自两个部门，一些是经理，一些是女性等。这些财产可能会根据情况增加/减少我想做一个算法，将人口一分为二，在所有属性的A和B中都有可能的最佳表示。所以我想要两组500人，两个部门人数相同，经理人数相同，女性人数相同。更具体地说，我想保持A和B中每个物业的比例。因此，如果我们有10%的经理，我希望样本A和样本B中的10%成为经理有关于从哪里开始的建议吗？我很肯定这种算法是存在

我想做一个算法，使A/B测试能够在不同数量的科目上进行，每个科目具有不同数量的属性

例如，我有1000人拥有以下财产：他们来自两个部门，一些是经理，一些是女性等。这些财产可能会根据情况增加/减少

我想做一个算法，将人口一分为二，在所有属性的A和B中都有可能的最佳表示。所以我想要两组500人，两个部门人数相同，经理人数相同，女性人数相同。更具体地说，我想保持A和B中每个物业的比例。因此，如果我们有10%的经理，我希望样本A和样本B中的10%成为经理

有关于从哪里开始的建议吗？我很肯定这种算法是存在的。我有一种直觉，这在某些情况下可能无法解决，因为可能会有奇数的经理和女性以及第一部门。

列出所有a/b变量的排列

 Dept1,Manager,Male
 Dept1,Manager,Female
 Dept1,Junior,Male
 ...
 Dept2,Junior,Female

遍历所有人，并将他们分配到各自的排列中。也许先将人们的顺序随机化，只是为了确保他们添加到每个排列中的顺序没有偏差

 Dept1,Manager,Male-> Person1, Person16, Person143...
 Dept1,Manager,Female-> Person7, Person10, Person83...

有第二个过程，通过每个排列，将一半的人分配给一个测试组，另一半分配给另一个测试组。你需要考虑小组中的奇数人，但这应该很容易考虑进去，显然，更大的样本量将减少这个奇数对最终结果的影响。

分组的算法很简单——选取所有维度都相同的每组人，将一半分配给治疗组，一半分配给对照组。你不必担心奇数的人，无论你使用什么统计测试都可以解释这一点。如果某个维度如此倾斜（即，在整个样本中只有2个女性），那么将该维度剔除可能是明智的

简单的A/B测试通常使用t测试或g测试，但在您的情况下，最好使用A/B测试来确定每个维度上治疗的重要性