R 创建显示变量总计的表格
我正在为自己的实践制作这个文件,Master.csv文件,来自。我想创建一个表,显示数据集中有多少人来自每个出生国。到目前为止,这是我尝试的代码,尽管我不确定我是否做了正确的事情。R还是新手,有什么帮助吗R 创建显示变量总计的表格,r,data.table,R,Data.table,我正在为自己的实践制作这个文件,Master.csv文件,来自。我想创建一个表,显示数据集中有多少人来自每个出生国。到目前为止,这是我尝试的代码,尽管我不确定我是否做了正确的事情。R还是新手,有什么帮助吗 dat<-read.csv("http://www3.amherst.edu/~nhorton/r2/datasets/Master.csv", header=TRUE,sep=",") library(data.table) DT <- as.data.table
dat<-read.csv("http://www3.amherst.edu/~nhorton/r2/datasets/Master.csv",
header=TRUE,sep=",")
library(data.table)
DT <- as.data.table(dat)
setkey(DT, birthCountry)
y<-DT[, lapply(.SD, sum, na.rm=TRUE), .(birthCountry)]
dat如果.csv
文件的每一行代表一个唯一的个体,您可以使用base R中的表
功能
table(dat$birthCountry)
如果我想找出数据集中所有有球员ID和经理ID的人的平均身高,该怎么办?
DT = fread("http://www3.amherst.edu/~nhorton/r2/datasets/Master.csv")
DT[,.N,by=birthCountry]
birthCountry N
1: USA 15421
2: Venezuela 256
3: D.R. 516
4: Mexico 111
5: Panama 51
... snip
DT[,.N,by=birthCountry][order(-N)]
birthCountry N
1: USA 15421
2: D.R. 516
3: 346
4: Venezuela 256
5: P.R. 231
...snip