重复计数-plyr包装的替代品
我有兴趣计算数据中的重复数,因此我可以证明使用kendall的tau计算变量之间的相关系数是合理的。以下命令正是我想要的:重复计数-plyr包装的替代品,r,ggplot2,duplicates,plyr,R,Ggplot2,Duplicates,Plyr,我有兴趣计算数据中的重复数,因此我可以证明使用kendall的tau计算变量之间的相关系数是合理的。以下命令正是我想要的: ddply(df,.(a,b ),nrow) # plyr package 但是,问题在于plyr包。一旦安装,我在运行ggplot命令时会出错 这是我在会话中安装的包的列表。我已尝试重新启动会话,没有用 packages(c("dplyr", "tidyr", "data.table", "ggplot2", "readxl", "magrittr", "tidyver
ddply(df,.(a,b ),nrow) # plyr package
但是,问题在于plyr
包。一旦安装,我在运行ggplot
命令时会出错
这是我在会话中安装的包的列表。我已尝试重新启动会话,没有用
packages(c("dplyr", "tidyr", "data.table", "ggplot2", "readxl", "magrittr", "tidyverse",
"ggpubr", "forcats", "car", "PerformanceAnalytics", "mtcars", "Hmisc", "gplots",
"nortest", "dunn.test", "psych", "FSA", "DescTools"))
我假设plyr
包以某种方式干扰了我的其他包
我如何解决这个问题
或
对于
ddply
命令,是否有其他解决方案?以下是一种使用基数R计算重复数的方法:
set.seed(111)
mydata <- sample(1:100, 100, 1)
(nDuplicates <- length(mydata) - length(unique(mydata)))
> (nDuplicates <- length(mydata) - length(unique(mydata)))
[1] 35
set.seed(111)
mydata下面是一种使用基数R计算重复数的方法:
set.seed(111)
mydata <- sample(1:100, 100, 1)
(nDuplicates <- length(mydata) - length(unique(mydata)))
> (nDuplicates <- length(mydata) - length(unique(mydata)))
[1] 35
set.seed(111)
mydata既然已经加载了dplyr,下面是一个使用mtcars的dplyr方法:
dups <- mtcars %>%
group_by(cyl) %>%
summarize(n()) %>%
print
dups%
组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别
汇总(n())%>%
打印
既然已经加载了dplyr,下面是一个使用mtcars的dplyr方法示例:
dups <- mtcars %>%
group_by(cyl) %>%
summarize(n()) %>%
print
dups%
组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别
汇总(n())%>%
打印
也许您可以使用长度(数据)-长度(唯一(数据))。如果数据是df而不是矢量nrows而不是长度,则可能有效,您可以使用length(数据)-lenght(唯一(数据))。如果数据是df而不是矢量,则nrows而不是长度可能会起作用