R 在原始数据中按组添加平均值列_R_Dataframe_Dplyr_Data.table - Fatal编程技术网

R 在原始数据中按组添加平均值列

r dataframe

R 在原始数据中按组添加平均值列,r,dataframe,dplyr,data.table,R,Dataframe,Dplyr,Data.table,我想在Rdata.frame中添加一列基于因子列的均值。像这样： df1 <- data.frame(X = rep(x = LETTERS[1:2], each = 3), Y = 1:6) df2 <- aggregate(data = df1, Y ~ X, FUN = mean) df3 <- merge(x = df1, y = df2, by = "X", suffixes = c(".Old",".New")) df3 # X Y.Old Y.New # 1

我想在

data.frame

中添加一列基于因子列的均值。像这样：

df1 <- data.frame(X = rep(x = LETTERS[1:2], each = 3), Y = 1:6)
df2 <- aggregate(data = df1, Y ~ X, FUN = mean)
df3 <- merge(x = df1, y = df2, by = "X", suffixes = c(".Old",".New"))
df3
#   X Y.Old Y.New
# 1 A     1     2
# 2 A     2     2
# 3 A     3     2
# 4 B     4     5
# 5 B     5     5
# 6 B     6     5

df1ddply
和transform
来拯救（尽管我相信你至少会有4种不同的方法来做到这一点）：
乔兰回答得很漂亮，这不是对你问题的回答，而是对话的延伸。如果您要查找两个分类变量与依赖项的关系的平均值表，这里有一个Hadley函数：
cast(CO2, Type ~ Treatment, value="uptake", fun.aggregate=mean, margins=TRUE)

以下是CO2数据的概览，以及均值表：
> head(CO2)
  Plant   Type  Treatment conc uptake
1   Qn1 Quebec nonchilled   95   16.0
2   Qn1 Quebec nonchilled  175   30.4
3   Qn1 Quebec nonchilled  250   34.8
4   Qn1 Quebec nonchilled  350   37.2
5   Qn1 Quebec nonchilled  500   35.3
6   Qn1 Quebec nonchilled  675   39.2

> library(reshape)

> cast(CO2, Type ~ Treatment, mean, margins=TRUE)  
         Type nonchilled  chilled    (all)
1      Quebec   35.33333 31.75238 33.54286
2 Mississippi   25.95238 15.81429 20.88333
3       (all)   30.64286 23.78333 27.21310

这就是ave
功能的作用
df1$Y.New <- ave(df1$Y, df1$X)

df1$Y.New两种替代方法：
1.随附包装：
两者都给出了以下结果：
真棒的回答。你想在dplyr
答案中group\u by
后面跟着mutate，这一点并不明显，所以这让我学到了这一点。
df1$Y.New <- ave(df1$Y, df1$X)

library(dplyr)
df1 <- df1 %>% 
  group_by(X) %>% 
  mutate(Y.new = mean(Y))

library(data.table)
setDT(df1)[, Y.new := mean(Y), by = X]

> df1
   X Y Y.new
1: A 1     2
2: A 2     2
3: A 3     2
4: B 4     5
5: B 5     5
6: B 6     5




[dataframe]相关文章推荐



                                                        
Dataframe 从Windows 10在Pyspark中创建数据帧问题
dataframepyspark 
如何将列名作为参数传递给Julia DataFrame？
dataframejulia 
Dataframe 在PySpark中创建许多空列
dataframepyspark 
Dataframe 关于在具有pyspark的数据帧上使用udf函数的列文字的错误
dataframepyspark 
Dataframe 如何消除数据帧中具有与其他数据帧相同值的行？斯图迪奥
dataframefilter 
Dataframe Spark：如何根据子集条件过滤数据
dataframeapache-spark 
Dataframe 如何将spark到elastic search的长历元列作为时间格式加载？
dataframeapache-spark 
Dataframe 建议-创建具有条件的新数据帧
dataframeapache-spark 
DataFrames.jl：定义计数列名时按组计数行
dataframejulia 
Dataframe 读取带空值的spark csv而不转换为null
dataframeapache-spark 
Dataframe 如何在Julia中对DateTime或Time类型执行模运算？
dataframedatetimetimejulia 
Dataframe 在pyspark中划分数据帧
dataframeapache-sparkpyspark 
Dataframe Alteryx regex_countmatches是否与pyspark中的等效项匹配？
dataframeapache-sparkpyspark 
Dataframe 在现有数据拆分上构建tf.keras.preprocessing.image.ImageDataGenerator
dataframetensorflowkeras 
Dataframe 在pyspark中拆分列
dataframepyspark 
                                       





随机文章推荐



                                                        
Magento2 如何获取Magento 2'中静态图像文件的url；什么是javascript文件？
magento2 
Magento2 如何在magento 2.0中重新索引magento索引
magento2 
在wishlist侧边栏magento2中添加大小和颜色等选项
magento2 
Magento2 magento 2后端中没有销售订单表
magento2 
Magento2 在magento 2中，模板中有哪些块方法可用？
magento2 
Magento2 未捕获错误：类'；GuzzleHttp\Client'；找不到
magento2 
Magento2 在类别页面上加载更多不能在porto主题magento 2中工作的产品
magento2 
Can'；不要在我的magento2商店中使用css库
magento2


                                        

                                        
                                        


                                                
                                                        [r]相关推荐
                                                        
R可处理NA'的软件包/型号；s
									R
							 
r2.XX.Y中的核心包
									R
							 
lubridate中的夏令时
									R
							 
R 在模型列表上使用Lappy
									R
							 
函数write.csv返回一个错误
									R
							 									Csv
							 
R data.table与自动完成兼容性
									R
							 
R 从自定义函数实现geom选项
									R
							 									Function
							 
R 如何在data.table中选择值？
									R
							 
如何在R中格式化数字，指定有效位数，但保留有效零和整数部分？
									R
							 									Formatting
							 
使用R，如何计算PDF文件中的页数？
									R
							 									Pdf
							 
使用coord_trans函数可以使数据从图形中消失
									R
							 
R 如何从用户创建的函数中添加新的数据列并关联到不同的列
									R
							 
根据不同的日期集，预测日期r
									R
							 
R 太多>；升华器输出
									R
							 									Sublimetext3
							 
R 以小时为单位获取第一个实例和最后一个实例之间的差异
									R
							 									Datetime
							 
R 在列中查找时间间隔
									R
							 									Date
							 
改变所有因子NA'；数据集R中的s
									R
							 
R 如何检测表'中的值；s列并将其减去另一列？
									R
							 									Dataframe
							 
忽略未知参数：point.color.1
									R
							 
R 散点图矩阵-错误：视口'；plot_01.panel.1.1.off.vp'；“未找到”；
									R
							 
R 通过复制长度超过1的元素来解包列表
									R
							 
使用R网状包重新加载Python模块
									R
							 
将向量列表展开为data.frame时匹配ID
									R
							 
R 如何切换字符串的第一个和最后一个元素的位置？
									R
							 
R 求和列，如果其他两列相等，则转换为宽计数表
									R
							 
有没有一种方法可以使用dplyr根据group_除以另一列创建一个新列？
									R
							 									For Loop
							 
R 如何将DT datatable单元格扩展到表内和表头的多列
									R
							 									Shiny
							 
R 基于另一个数据帧的值插值缺少的列值
									R
							 									Dataframe
							 
R–；将函数应用于列表中的特定列
									R
							 
使用rvest:：read_html时更改用户代理
									R
							 									Web Scraping
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Prometheus
Events
Logstash
C++
Map
Virtual Machine
Gmail
Webrtc
Leaflet
Webstorm
Uitableview
Replace
Properties
Here Api
Abap
Google Api
Processing
Data Binding
Pointers
Variables
Xamarin
Javafx 2
Amazon Redshift
Sublimetext3
Next.js
Jquery
Pandas
Bash
Rabbitmq
Actionscript 3
Backbone.js
Swagger
Scrapy
Jsf
Cloud Foundry
Floating Point
Rspec
Google Bigquery
Core Data
Excel
Phpmyadmin
Oracle11g
Graph
Qt
Wso2
Data Structures
Apache Storm
Pine Script
Kibana
Iis 7
Project Management
Vbscript
Debugging
Aframe
Magento2
Unix
Devexpress
Sprite Kit
Operating System
Xamarin.android
Pagination
Jaxb
Google Visualization
Blackberry
Ant
Odata
Firebase
Sql Server 2008 R2
Xaml
Qml
Hive
Google Maps Api 3
Sql Server 2012
Atom Editor
Paypal
Com
Phpstorm
Random
Ember.js
Ms Office
Class
Apache Spark
Openshift
Gitlab
Extjs4
Asp.net
Neo4j
Go
Sip
Serial Port
Ruby On Rails 4
Plugins
Websphere
Ecmascript 6
Elixir
Blazor
Mule
Google Cloud Storage
Sails.js
Ios5
Hyperlink
.net Core
Shell
Visual Studio 2017
Ssas
E Commerce
Delphi
Sugarcrm
Visual Studio 2015
Fullcalendar
Animation
Session
Google Plus
Kendo Ui
C++ Cli
Compiler Errors
Gradle
Ubuntu
.net 4.0
Cygwin
Highcharts
Azure Data Factory
Sqlite
Opengl Es
Utf 8
Sql
Android Fragments
Sdk
Lucene
Opencl
Swift3
Ruby On Rails 3.2
Url
Inno Setup
Numpy
Nservicebus
Grails
Clang
Amazon Web Services
Orientdb
Azure Cosmosdb
Jquery Mobile
Coding Style
Cmake
Lambda
Pip
Passwords
Collections
Arangodb
Elm
Reference
Google Drive Api
Internationalization
Sms
Stored Procedures
Browser
Time
Doxygen
Tensorflow
Typescript
Fluent Nhibernate
Oracle Apex
Asp.net Core
Tinymce
Ipython
Youtube
Sql Server 2005
Anaconda
Documentation
Oop
Sharepoint 2010
Nativescript
Vagrant
Visual Studio 2013
Web Scraping
Ssh
Npm
Gstreamer
Yocto
Reflection
Stripe Payments
Css
.htaccess
Hazelcast
Android Ndk
Drupal 6
Cassandra
Teamcity
Google Calendar Api
Maven
Gulp
Cron
C# 4.0
Safari
Dns
Terraform
Keycloak
Mongoose
Node.js
Service
Puppet


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网