SQL-统计正态分布量范围

SQL-统计正态分布量范围,sql,sql-server,statistics,Sql,Sql Server,Statistics,我有一个SQL Server数据库表,其中包含大约10万条发票记录(日期、供应商、类型和金额) 以下是示例数据: 我想根据数量将数据分为4个部分 第1组:X3 其中X1、X2和X3是数量,但这些数量应基于正态分布进行统计计算,以便它们有意义 所以我想我必须得到我的平均值(数量)和标准偏差(数量),以便知道我的X1、X2和X3值应该是可以接受的 关于如何执行此操作的任何线索,使值对报告有意义,以便我可以生成如下图表: 因此,我假设您的X标记定义了金额分布的四分位数。子查询可用于均值和标准差,和

我有一个
SQL Server
数据库表,其中包含大约10万条发票记录(日期、供应商、类型和金额)

以下是示例数据:

我想根据数量将数据分为4个部分

  • 第1组:
  • 第2组:X1和X2之间
  • 第3组:在X2和X3之间
  • 第4组:>X3
  • 其中X1、X2和X3是数量,但这些数量应基于正态分布进行统计计算,以便它们有意义

    所以我想我必须得到我的平均值(数量)和标准偏差(数量),以便知道我的X1、X2和X3值应该是可以接受的

    关于如何执行此操作的任何线索,使值对报告有意义,以便我可以生成如下图表:

    因此,我假设您的X标记定义了金额分布的四分位数。子查询可用于均值和标准差,和函数可用于此

    SELECT CASE WHEN Amount < (SELECT AVG(Amount) FROM yourTable) -
                              (SELECT STDEVP(Amount) FROM yourTable)
                THEN 'Group 1'
                WHEN Amount < (SELECT AVG(Amount) FROM yourTable) THEN 'Group 2'
                WHEN Amount < (SELECT AVG(Amount) FROM yourTable) +
                              (SELECT STDEVP(Amount) FROM yourTable)
                THEN 'Group 3'
                ELSE 'Group 4'
           END
    FROM yourTable
    
    X1 - One standard deviation below the mean Amount
    X2 - The mean value of the Amount
    X3 - One standard deviation about the mean Amount