按列对数据进行分组,并获得R中其余变量的平均值

按列对数据进行分组,并获得R中其余变量的平均值,r,R,我总共有21k次观察。为了进行聚类分析,我想将21K观测值按“邻里”列分组(共有140个邻里)。所以我想按“邻里”分组,得到每个邻里定量变量的平均值(如“购买价格”)和定性变量的模式(如“能源证书”、“有停车位”等)。 因此,数据集仅为140行(邻域),其平均值和模式取决于相关变量。 我希望有人能帮助我。提前非常感谢。我将用mtcars和dplyr进行模拟 库(dplyr) 数量% 汇总(跨越(数量、平均数)、跨越(质量、名称)(排序(表(.),递减=真))[1])) ##tibble:3 x

我总共有21k次观察。为了进行聚类分析,我想将21K观测值按“邻里”列分组(共有140个邻里)。所以我想按“邻里”分组,得到每个邻里定量变量的平均值(如“购买价格”)和定性变量的模式(如“能源证书”、“有停车位”等)。 因此,数据集仅为140行(邻域),其平均值和模式取决于相关变量。
我希望有人能帮助我。提前非常感谢。

我将用
mtcars
dplyr
进行模拟

库(dplyr)
数量%
汇总(跨越(数量、平均数)、跨越(质量、名称)(排序(表(.),递减=真))[1]))
##tibble:3 x 7
#气缸mpg显示hp与am档位
#         
# 1     4  26.7  105.  八十二点六一一四
# 2     6  19.7  183. 1221     0     4    
# 3     8  15.1  353. 2090     0     3    
名称(表()[1]
是定性变量的“模式”。我们可以通过快速表格验证它是否达到了我们的预期:

xtabs(~cyl+vs,data=mtcars)
#vs
#01团
#   4  1 10
#   6  3  4
#   8 14  0
xtabs(~cyl+am,数据=mtcars)
#上午
#01团
#   4  3  8
#   6  4  3
#   8 12  2
xtabs(~cyl+档位,数据=mtcars)
#齿轮
#共青团345
#   4  1  8  2
#   6  2  4  1
#   8 12  0  2
表明对于4档、6档和8档,最常见的
vs
1
1
0
;对于
am
1
0
0
;对于
gear
4
4
3
。这些对应于上面返回的值


在您的情况下,将
cyl
更改为
neighborary
,并确保您的
qual
quant
列出了所需的变量。

不可思议的大师,非常感谢:))您能提供一个可重复的示例吗?数据集的屏幕截图没有帮助。