R 数据集长度的确定
当我在R 数据集长度的确定,r,R,当我在ISLR包中读取Auto数据集时,乍一看似乎有397个观察值。我使用tail()函数确定了这一点。实际上有392次观察。我怎样才能清楚地找出遗漏了哪些观察结果?我需要一种方法来检查输出最左边的数字序列 nrow(Auto)表明确实有392个观察值,就像?Auto一样: 392辆车的汽油里程、马力和其他信息 文件还说 原始(sic)数据包含408个观测值,但包含16个观测值 已删除缺少值的 只是猜测,但大概有5个遗漏的观测值在数据的“主体”内,另外11个在最后。。。要查看行号不连续的位置,请
ISLR
包中读取Auto
数据集时,乍一看似乎有397个观察值。我使用tail()
函数确定了这一点。实际上有392次观察。我怎样才能清楚地找出遗漏了哪些观察结果?我需要一种方法来检查输出最左边的数字序列 nrow(Auto)
表明确实有392个观察值,就像?Auto
一样:
392辆车的汽油里程、马力和其他信息
文件还说
原始(sic)数据包含408个观测值,但包含16个观测值
已删除缺少值的
只是猜测,但大概有5个遗漏的观测值在数据的“主体”内,另外11个在最后。。。要查看行号不连续的位置,请尝试
setdiff(1:397,rownames(Auto))
[1] 33 127 331 337 355
不太直接有用,但是
which(diff(as.numeric(rownames(Auto)))>1)
可能也很方便。
?setdiff
可能-例如setdiff(1:5,c(1,2,4,5))
返回3
>setdiff(1:397,row.names(Auto))[1]33 127 331 337 355如果这个答案有用,你可以投票(如果你有足够的声誉),无论如何,如果它满意地回答了您的问题,我们鼓励您点击复选标记接受它。非常好的回答,谢谢。