重复计数-plyr包装的替代品_R_Ggplot2_Duplicates_Plyr

重复计数-plyr包装的替代品

重复计数-plyr包装的替代品,r,ggplot2,duplicates,plyr,R,Ggplot2,Duplicates,Plyr,我有兴趣计算数据中的重复数，因此我可以证明使用kendall的tau计算变量之间的相关系数是合理的。以下命令正是我想要的： ddply(df,.(a,b ),nrow) # plyr package 但是，问题在于plyr包。一旦安装，我在运行ggplot命令时会出错这是我在会话中安装的包的列表。我已尝试重新启动会话，没有用 packages(c("dplyr", "tidyr", "data.table", "ggplot2", "readxl", "magrittr", "tidyver

我有兴趣计算数据中的重复数，因此我可以证明使用kendall的tau计算变量之间的相关系数是合理的。以下命令正是我想要的：

ddply(df,.(a,b ),nrow) # plyr package

但是，问题在于

plyr

包。一旦安装，我在运行

ggplot

命令时会出错

这是我在会话中安装的包的列表。我已尝试重新启动会话，没有用

packages(c("dplyr", "tidyr", "data.table", "ggplot2", "readxl", "magrittr", "tidyverse",
           "ggpubr", "forcats", "car", "PerformanceAnalytics", "mtcars", "Hmisc", "gplots",
           "nortest", "dunn.test", "psych", "FSA", "DescTools"))

我假设

plyr

包以某种方式干扰了我的其他包

我如何解决这个问题

或

对于
ddply
命令，是否有其他解决方案？

以下是一种使用基数R计算重复数的方法：

set.seed(111)
mydata <- sample(1:100, 100, 1)
(nDuplicates <- length(mydata) - length(unique(mydata)))

> (nDuplicates <- length(mydata) - length(unique(mydata)))
[1] 35

set.seed（111）
mydata下面是一种使用基数R计算重复数的方法：
set.seed(111)
mydata <- sample(1:100, 100, 1)
(nDuplicates <- length(mydata) - length(unique(mydata)))

> (nDuplicates <- length(mydata) - length(unique(mydata)))
[1] 35

set.seed（111）
mydata既然已经加载了dplyr，下面是一个使用mtcars的dplyr方法：
dups <- mtcars %>%
      group_by(cyl) %>%
      summarize(n()) %>%
      print

dups%
组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别
汇总（n（））%>%
打印
既然已经加载了dplyr，下面是一个使用mtcars的dplyr方法示例：
dups <- mtcars %>%
      group_by(cyl) %>%
      summarize(n()) %>%
      print

dups%
组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别
汇总（n（））%>%
打印
也许您可以使用长度（数据）-长度（唯一（数据））。如果数据是df而不是矢量nrows而不是长度，则可能有效，您可以使用length（数据）-lenght（唯一（数据））。如果数据是df而不是矢量，则nrows而不是长度可能会起作用