R 通过不同的计数方法得出不同的结果
我有一个data.frame df2,我想找到'var'大于140的行数。我使用了以下方法,它们给了我不同的结果R 通过不同的计数方法得出不同的结果,r,R,我有一个data.frame df2,我想找到'var'大于140的行数。我使用了以下方法,它们给了我不同的结果 > morevar = df2$var > 140 > describe(morevar) morevar n missing unique 8388 58 2 FALSE (8352, 100%), TRUE (36, 0%) (36用这种方法) (36用这种方法) (按此方法计算) excel表格中的计数为3
> morevar = df2$var > 140
> describe(morevar)
morevar
n missing unique
8388 58 2
FALSE (8352, 100%), TRUE (36, 0%)
(36用这种方法)
(36用这种方法)
(按此方法计算)
excel表格中的计数为36(通过排序和直接计数)
请帮忙 58(缺失)+36=94
从帮助(“[”)
:
索引中的NAs
提取时,数字、逻辑或字符NA索引选择一个
未知元素,因此在
逻辑、整数、数字、复数或字符结果,对于
列表。(原始结果返回00。)
因此,请使用length(na.omit(df3$var))
尝试以下代码:
x <- na.omit (df2)
nrow(subset(x, x$var>140)
x140)
你能给我们提供样本数据吗?如果不知道变量的类别和NA
s的存在,很难判断。你是否附加了df2?否则我看不出你的第三种方法会如何工作。它应该是df3 140,]
。NAs造成了差异。使用na.omit(…它工作正常。谢谢。df3=df…与df3I有什么不同?我没有附加df3。我只看到选择了94个观察值,并且我假设它们都有var>140。是的。方法3中包含了缺失的值。使用函数na.omit(df3$var)可以提供36个条目。谢谢。
> df3 = df2[var>140,]
> str(df3)
'data.frame': 94 obs. of 44 variables:
x <- na.omit (df2)
nrow(subset(x, x$var>140)