按列对数据进行分组，并获得R中其余变量的平均值_R

按列对数据进行分组，并获得R中其余变量的平均值

按列对数据进行分组，并获得R中其余变量的平均值,r,R,我总共有21k次观察。为了进行聚类分析，我想将21K观测值按“邻里”列分组（共有140个邻里）。所以我想按“邻里”分组，得到每个邻里定量变量的平均值（如“购买价格”）和定性变量的模式（如“能源证书”、“有停车位”等）。因此，数据集仅为140行（邻域），其平均值和模式取决于相关变量。我希望有人能帮助我。提前非常感谢。我将用mtcars和dplyr进行模拟库（dplyr）数量% 汇总（跨越（数量、平均数）、跨越（质量、名称）（排序（表（.），递减=真））[1]）） ##tibble:3 x

我总共有21k次观察。为了进行聚类分析，我想将21K观测值按“邻里”列分组（共有140个邻里）。所以我想按“邻里”分组，得到每个邻里定量变量的平均值（如“购买价格”）和定性变量的模式（如“能源证书”、“有停车位”等）。因此，数据集仅为140行（邻域），其平均值和模式取决于相关变量。

我希望有人能帮助我。提前非常感谢。

我将用

mtcars

和

dplyr

进行模拟

库（dplyr）
数量%
汇总（跨越（数量、平均数）、跨越（质量、名称）（排序（表（.），递减=真））[1]））
##tibble:3 x 7
#气缸mpg显示hp与am档位
#         
# 1     4  26.7  105.  八十二点六一一四
# 2     6  19.7  183. 1221     0     4    
# 3     8  15.1  353. 2090     0     3

名称（表（）[1]

是定性变量的“模式”。我们可以通过快速表格验证它是否达到了我们的预期：

xtabs（~cyl+vs，data=mtcars）
#vs
#01团
#   4  1 10
#   6  3  4
#   8 14  0
xtabs（~cyl+am，数据=mtcars）
#上午
#01团
#   4  3  8
#   6  4  3
#   8 12  2
xtabs（~cyl+档位，数据=mtcars）
#齿轮
#共青团345
#   4  1  8  2
#   6  2  4  1
#   8 12  0  2

表明对于4档、6档和8档，最常见的

vs

是

、

和

；对于

am

：

、

和

；对于

gear

：

、

和

。这些对应于上面返回的值

在您的情况下，将

cyl

更改为

neighborary

，并确保您的

qual

和

quant

列出了所需的变量。

不可思议的大师，非常感谢：））您能提供一个可重复的示例吗？数据集的屏幕截图没有帮助。