按列对数据进行分组,并获得R中其余变量的平均值
我总共有21k次观察。为了进行聚类分析,我想将21K观测值按“邻里”列分组(共有140个邻里)。所以我想按“邻里”分组,得到每个邻里定量变量的平均值(如“购买价格”)和定性变量的模式(如“能源证书”、“有停车位”等)。 因此,数据集仅为140行(邻域),其平均值和模式取决于相关变量。按列对数据进行分组,并获得R中其余变量的平均值,r,R,我总共有21k次观察。为了进行聚类分析,我想将21K观测值按“邻里”列分组(共有140个邻里)。所以我想按“邻里”分组,得到每个邻里定量变量的平均值(如“购买价格”)和定性变量的模式(如“能源证书”、“有停车位”等)。 因此,数据集仅为140行(邻域),其平均值和模式取决于相关变量。 我希望有人能帮助我。提前非常感谢。我将用mtcars和dplyr进行模拟 库(dplyr) 数量% 汇总(跨越(数量、平均数)、跨越(质量、名称)(排序(表(.),递减=真))[1])) ##tibble:3 x
我希望有人能帮助我。提前非常感谢。我将用
mtcars
和dplyr
进行模拟
库(dplyr)
数量%
汇总(跨越(数量、平均数)、跨越(质量、名称)(排序(表(.),递减=真))[1]))
##tibble:3 x 7
#气缸mpg显示hp与am档位
#
# 1 4 26.7 105. 八十二点六一一四
# 2 6 19.7 183. 1221 0 4
# 3 8 15.1 353. 2090 0 3
名称(表()[1]
是定性变量的“模式”。我们可以通过快速表格验证它是否达到了我们的预期:
xtabs(~cyl+vs,data=mtcars)
#vs
#01团
# 4 1 10
# 6 3 4
# 8 14 0
xtabs(~cyl+am,数据=mtcars)
#上午
#01团
# 4 3 8
# 6 4 3
# 8 12 2
xtabs(~cyl+档位,数据=mtcars)
#齿轮
#共青团345
# 4 1 8 2
# 6 2 4 1
# 8 12 0 2
表明对于4档、6档和8档,最常见的vs
是1
、1
和0
;对于am
:1
、0
和0
;对于gear
:4
、4
和3
。这些对应于上面返回的值
在您的情况下,将
cyl
更改为neighborary
,并确保您的qual
和quant
列出了所需的变量。不可思议的大师,非常感谢:))您能提供一个可重复的示例吗?数据集的屏幕截图没有帮助。