需要帮助将列数据组织和汇总到R标记中吗
对不起,如果这是一个简单的问题,但我有一个问题 我将一个.csv文件导入RStudio。下面链接的图片是其外观的一个示例。我想为每种类型(宝马、梅赛德斯、本田)创建单独的数据帧,然后为每个子集数据帧创建汇总统计数据需要帮助将列数据组织和汇总到R标记中吗,r,r-markdown,R,R Markdown,对不起,如果这是一个简单的问题,但我有一个问题 我将一个.csv文件导入RStudio。下面链接的图片是其外观的一个示例。我想为每种类型(宝马、梅赛德斯、本田)创建单独的数据帧,然后为每个子集数据帧创建汇总统计数据 我很迷茫,我甚至不能真正找出这个问题的正确标题。任何帮助都将不胜感激。为每种类型创建单个数据。可以使用split功能为每种类型创建帧,然后使用数据帧列表上的lappy计算每个数据帧的汇总统计信息 split_dfs <- split(your_data, your_data$
我很迷茫,我甚至不能真正找出这个问题的正确标题。任何帮助都将不胜感激。为每种类型创建单个
数据。可以使用split
功能为每种类型创建帧,然后使用数据帧列表上的lappy
计算每个数据帧的汇总统计信息
split_dfs <- split(your_data, your_data$type)
summary_stats <- lapply(split_dfs, function(x){
data.frame(
mean_price = mean(x$price)
)
})
另一个库是data.table
library,它使具有多个组的大型数据集的计算变得更容易,最重要的是更快,计算结果如下所示
require(data.table)
your_dt <- as.data.table(your_data)
summary_stats <- your_dt[, .(mean_price=mean(price)), by="type"]
require(data.table)
你最好把问题限制在一个问题以内。有多个问题;多问一些单独的问题。另外,添加一些sampole数据(使用dput()
)可以增加获得好答案的机会。最好的做法是将输入和期望的输出加上简短的解释。好的,我整理了我的问题,并添加了一个直观的示例,说明我的数据目前是什么样子的。我认为base R应该做这个技巧,以便对数据进行子集,例如:merc非常感谢。我真不敢相信这么简单。在过去的一个小时里,我一直在用谷歌搜索并找出答案。再次感谢。
require(data.table)
your_dt <- as.data.table(your_data)
summary_stats <- your_dt[, .(mean_price=mean(price)), by="type"]