如何用SQL中的PDF创建CDF
所以我有一个数据表,看起来像下面这样。ID表示一个对象,bin表示我如何分割数据,百分比表示有多少数据落入该bin如何用SQL中的PDF创建CDF,sql,Sql,所以我有一个数据表,看起来像下面这样。ID表示一个对象,bin表示我如何分割数据,百分比表示有多少数据落入该bin id bin percent 2 8 0.20030698388 2 16 0.14504988488 2 24 0.12356101304 2 32 0.09976976208 2 40 0.09056024558 2 48 0.07137375287 2 56 0.04067536454 2 64 0.03914044512
id bin percent
2 8 0.20030698388
2 16 0.14504988488
2 24 0.12356101304
2 32 0.09976976208
2 40 0.09056024558
2 48 0.07137375287
2 56 0.04067536454
2 64 0.03914044512
2 72 0.02916346891
2 80 0.16039907904
3 8 0.36316695352
3 16 0.03958691910
3 24 0.11876075731
3 32 0.13253012048
3 40 0.03098106712
3 48 0.07228915662
3 56 0.07745266781
3 64 0.02581755593
3 72 0.02065404475
3 80 0.11876075731
我正在寻找一个函数来将此数据集转换为cdf分区id。我尝试了cume_dist和percent_rank,但它们似乎不起作用。我面临着类似的问题,并找到了这本非常好的教程来实现这一点:
它尝试重建Excel函数NORM.DIST,如果将累积标志设置为FALSE,则会生成PDF;如果将累积标志设置为TRUE,则会生成CDF。我假设CUME_DIST将在SQL中执行完全相同的操作。然而,事实证明后者是通过计算元素来分布的,而Excel使用的是值的相对差异 不确定您使用的是哪种sql,但您只需要一个cumsum。见例。