Statistics 如何描述值的分布?

Statistics 如何描述值的分布?,statistics,distribution,data-analysis,Statistics,Distribution,Data Analysis,我试着用一个例子来解释它 一所学校有n个班级。每个班有k个学生,k从1到700,n和k都是已知的 我需要一种方法来描述每个班级学生姓名的分布情况。例如,A班有10个学生,3个叫约翰,3个叫马克,3个叫安妮。另一个班有100名学生,每个人都叫安东 我需要一个能够指示每个类中名称分布的度量。例如,这并不重要,如果一个类中的每个人都有相同的名称,那么它可能是1;如果同一个类中没有两个相同的名称,那么它可能是0 换句话说,一种按名称分布对类进行排序的方法。听起来像是您想要一个。您希望将哪些变量作为行或列

我试着用一个例子来解释它

一所学校有n个班级。每个班有k个学生,k从1到700,n和k都是已知的

我需要一种方法来描述每个班级学生姓名的分布情况。例如,A班有10个学生,3个叫约翰,3个叫马克,3个叫安妮。另一个班有100名学生,每个人都叫安东

我需要一个能够指示每个类中名称分布的度量。例如,这并不重要,如果一个类中的每个人都有相同的名称,那么它可能是1;如果同一个类中没有两个相同的名称,那么它可能是0

换句话说,一种按名称分布对类进行排序的方法。

听起来像是您想要一个。您希望将哪些变量作为行或列是任意的,但是表条目是类别交叉点中出现的次数的计数或比例

以您给出的示例为例:

                     Class
                  A        B
              _________________
       Anne  |    3   |    0   |   3
Names  Anton |    0   |  100   | 100
       John  |    3   |    0   |   3
       Mark  |    3   |    0   |   3
    Unknown  |    1   |    0   |   1
             |--------|--------|----
                 10      100   | 110
右边和底部的值称为边际总量,如果是比例,则称为边际分布。右下角是数据的总和,通过对行或列边距求和获得。他们最好还是一样出来!对于比例,总和必须为1