Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/sorting/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R中事务的排序数据帧_R_Sorting - Fatal编程技术网

R中事务的排序数据帧

R中事务的排序数据帧,r,sorting,R,Sorting,我的数据在一个名为CspadeData.txt的文件中,它相当大(1100万行)。我把它和我的电脑连接起来了 我试图在cspade()函数中使用此数据: library(arulesSequences) x <- read_baskets(con = "CspadeData.txt", info = c('sequenceID','eventID','SIZE'), sep = ' ') s1 <- cspade(x, parameter = list(support = 0,

我的数据在一个名为CspadeData.txt的文件中,它相当大(1100万行)。我把它和我的电脑连接起来了

我试图在
cspade()
函数中使用此数据:

library(arulesSequences)

x <- read_baskets(con = "CspadeData.txt", info = c('sequenceID','eventID','SIZE'), sep = ' ')

s1 <- cspade(x, parameter = list(support = 0, maxsize = 1, maxlen = 1), 
             control = list(memsize = 65536, verbose = TRUE))
parameter specification:
support : 0
maxsize : 1
maxlen  : 1

algorithmic control:
bfstype  : FALSE
verbose  :  TRUE
summary  : FALSE
tidLists : FALSE
memsize  : 65536

preprocessing ...Error in makebin(data, file) : 'eid' invalid (strict order)
库(arulesSequences)

x可能一些事件ID在“语法”上是无效的,比如一个空格或其他什么。至少你可以这样挑起这个错误。read_baskets已在订单出现问题时向您发出警告。顺便说一句:你找到你的问题的解决方案了吗?@lukeA我不是100%肯定,但我认为另一篇文章与maxwin选项有关。如果我调用str(data)时eventID列被列为int,这不意味着不能有额外的空格吗?否则它会将列格式化为chr变量类型?我想是的-cspade是否也会使用数字EventID抛出错误?我的电脑无法处理如此大量的数据,因此我无法通过反复试验来复制这些数据。我使用read_baskets()函数从txt文件中读取数据。因为cspade()不使用数据帧。我不确定我是否可以更改变量类型。可能有些事件ID在“语法”上无效,比如只是一个空格或什么的。至少你可以这样挑起这个错误。read_baskets已在订单出现问题时向您发出警告。顺便说一句:你找到你的问题的解决方案了吗?@lukeA我不是100%肯定,但我认为另一篇文章与maxwin选项有关。如果我调用str(data)时eventID列被列为int,这不意味着不能有额外的空格吗?否则它会将列格式化为chr变量类型?我想是的-cspade是否也会使用数字EventID抛出错误?我的电脑无法处理如此大量的数据,因此我无法通过反复试验来复制这些数据。我使用read_baskets()函数从txt文件中读取数据。因为cspade()不使用数据帧。我不确定我是否可以更改变量类型。
data <- read.table(file = "CspadeData.txt", sep = " ", stringsAsFactors = FALSE)
str(data)
data <- data[order(data$V1,data$V2),]
write.table(data, file = "CspadeData.txt", sep = " ", row.names = FALSE, col.names = FALSE)