如何确定R中的数字是否连续?

如何确定R中的数字是否连续?,r,statistics,R,Statistics,我有一系列的价值观 c(1,2,3,4,5,8,9,10,13,14,15) 我想找出数字不连续的范围。我只想将其作为输出: (1,5) (8,10) (13,15) 我需要找到断点 我需要在R里做这件事。像这样的吗 x <- c(1:5, 8:10, 13:15) # example data unname(tapply(x, cumsum(c(1, diff(x)) != 1), range) # [[1]] # [1] 1 5 # # [[2]] # [1] 8 10 #

我有一系列的价值观

c(1,2,3,4,5,8,9,10,13,14,15)
我想找出数字不连续的范围。我只想将其作为输出:

(1,5)
(8,10)
(13,15)
我需要找到断点

我需要在R里做这件事。

像这样的吗

x <- c(1:5, 8:10, 13:15) # example data
unname(tapply(x, cumsum(c(1, diff(x)) != 1), range)
# [[1]]
# [1] 1 5
# 
# [[2]]
# [1]  8 10
# 
# [[3]]
# [1] 13 15

x
x假设您不关心确切的输出,并且正在寻找每个范围的最小值和最大值,您可以使用diff/cumsum/range,如下所示:

x  <- c(1:5, 8:10, 13:15)
x. <- c(0, cumsum( diff(x)-1 ) ) 

lapply( split(x, x.), range )

xI发布了
sekle
,它将在一行中为您完成这项工作。您可以加载包
cgwtools
或搜索代码,因为它已经发布了好几次。

为什么(1,5)在1和5之间有一个间隔时是预期的输出?你的价值观中没有4,改变了。只是一个疏忽。是的,我在Python中找到了一个解决方案,但我在R中这样做。我想看看你的Python解决方案:@thecoder16可能会被x-seq_沿着(x)分割,而不是使用rle?@user20650——问题是这样的向量不安全:
x
x <- c(1:5, 8:10, 13:15)    
rr <- rle(x - seq_along(x))
rr$values <- seq_along(rr$values)
s <- split(x, inverse.rle(rr))
s
# $`1`
# [1] 1 2 3 4 5
# 
# $`2`
# [1]  8  9 10
# 
# $`3`
# [1] 13 14 15

## And then to get *literally* what you asked for:
cat(paste0("(", gsub(":", ",", sapply(s, deparse)), ")"), sep="\n")
# (1,5)
# (8,10)
# (13,15)
x  <- c(1:5, 8:10, 13:15)
x. <- c(0, cumsum( diff(x)-1 ) ) 

lapply( split(x, x.), range )