R 嵌套数据中观察值的总数
好吧,我不知道为什么我不知道怎么做。我知道它必须相当简单 我有一个由学校(COMBOKEY)和学区(LEAID)组成的大型数据框架。我需要计算每个地区的学校数量,以便计算每个地区的平均学校数量。以下是数据结构的示例:R 嵌套数据中观察值的总数,r,R,好吧,我不知道为什么我不知道怎么做。我知道它必须相当简单 我有一个由学校(COMBOKEY)和学区(LEAID)组成的大型数据框架。我需要计算每个地区的学校数量,以便计算每个地区的平均学校数量。以下是数据结构的示例: COMBOKEY LEAID 13745 1037 13747 1037 13753 1037 13756 1037 13757 1037 13760 1038 13761 1038 13762 1039 13763
COMBOKEY LEAID
13745 1037
13747 1037
13753 1037
13756 1037
13757 1037
13760 1038
13761 1038
13762 1039
13763 1039
13770 1040
13771 1040
13776 1041
13778 1041
13781 1041
13788 1043
13790 1043
或者,以下是r代码中的示例:
head(cbind(Tot_CRDC1$COMBOKEY, Tot_CRDC1$LEAID))
[,1] [,2]
[1,] 1 1
[2,] 2 1
[3,] 3 1
[4,] 7 2
[5,] 8 2
[6,] 11 2
非常感谢你耐心的帮助。同时,我会继续在论坛上搜索一个对我的新手来说有意义的解决方案,因为我知道这必须有无数种不同的方式来回答
以下是对返回NAs的聚合的尝试:
head(aggregate(COMBOKEY ~ LEAID, Tot_CRDC1, mean, na.rm=TRUE))
LEAID COMBOKEY
1 0100005 NA
2 0100006 NA
3 0100007 NA
4 0100008 NA
5 0100011 NA
6 0100013 NA
据我所知,每个学校都由一条数据线表示,那么table()呢:
Ahead(聚合(COMBOKEY~LEAID,Tot_CRDC1,mean))LEAID COMBOKEY 1 0100005 NA 2 0100006 NA 3 0100007 NA 4 0100008 NA 5 0100011 NA 6 0100013 NAI使用了该代码并获得了NAs。您确定拼写COMBOKEY
正确吗?在您发布的评论中,您使用了两个操作系统,而不是一个O和一个0。这毫无意义。您使用的是两个不同的数据集吗?你的大脑完全不同你是对的Richard。使用聚合的示例是实际数据。我发布的第一个帖子,我虚构了一个想法,因为某种原因,它会更容易。我为错误的方向道歉。是否有一个弱的方法来调整它以获得调和平均值?如果这应该作为一个单独的问题发布,我可以重新发布。谢谢。图书馆(心理学);调和平均值(c(A))这是有效的,但返回0。原来的平均值是3.59。我现在不知道你有什么问题。调和平均值可以看作是算术平均值的函数,因此您也可以使用:1/mean(1/c(a))
Got it。一些挥之不去的0把事情搞砸了。你提供的两个答案:图书馆(心理学);调和平均值(c(A))和1/平均值(1/c(A))工作正常。再次感谢。
A<-table(LEAID)
mean(A)