R中事务的排序数据帧
我的数据在一个名为CspadeData.txt的文件中,它相当大(1100万行)。我把它和我的电脑连接起来了 我试图在R中事务的排序数据帧,r,sorting,R,Sorting,我的数据在一个名为CspadeData.txt的文件中,它相当大(1100万行)。我把它和我的电脑连接起来了 我试图在cspade()函数中使用此数据: library(arulesSequences) x <- read_baskets(con = "CspadeData.txt", info = c('sequenceID','eventID','SIZE'), sep = ' ') s1 <- cspade(x, parameter = list(support = 0,
cspade()
函数中使用此数据:
library(arulesSequences)
x <- read_baskets(con = "CspadeData.txt", info = c('sequenceID','eventID','SIZE'), sep = ' ')
s1 <- cspade(x, parameter = list(support = 0, maxsize = 1, maxlen = 1),
control = list(memsize = 65536, verbose = TRUE))
parameter specification:
support : 0
maxsize : 1
maxlen : 1
algorithmic control:
bfstype : FALSE
verbose : TRUE
summary : FALSE
tidLists : FALSE
memsize : 65536
preprocessing ...Error in makebin(data, file) : 'eid' invalid (strict order)
库(arulesSequences)
x可能一些事件ID在“语法”上是无效的,比如一个空格或其他什么。至少你可以这样挑起这个错误。read_baskets已在订单出现问题时向您发出警告。顺便说一句:你找到你的问题的解决方案了吗?@lukeA我不是100%肯定,但我认为另一篇文章与maxwin选项有关。如果我调用str(data)时eventID列被列为int,这不意味着不能有额外的空格吗?否则它会将列格式化为chr变量类型?我想是的-cspade是否也会使用数字EventID抛出错误?我的电脑无法处理如此大量的数据,因此我无法通过反复试验来复制这些数据。我使用read_baskets()函数从txt文件中读取数据。因为cspade()不使用数据帧。我不确定我是否可以更改变量类型。可能有些事件ID在“语法”上无效,比如只是一个空格或什么的。至少你可以这样挑起这个错误。read_baskets已在订单出现问题时向您发出警告。顺便说一句:你找到你的问题的解决方案了吗?@lukeA我不是100%肯定,但我认为另一篇文章与maxwin选项有关。如果我调用str(data)时eventID列被列为int,这不意味着不能有额外的空格吗?否则它会将列格式化为chr变量类型?我想是的-cspade是否也会使用数字EventID抛出错误?我的电脑无法处理如此大量的数据,因此我无法通过反复试验来复制这些数据。我使用read_baskets()函数从txt文件中读取数据。因为cspade()不使用数据帧。我不确定我是否可以更改变量类型。
data <- read.table(file = "CspadeData.txt", sep = " ", stringsAsFactors = FALSE)
str(data)
data <- data[order(data$V1,data$V2),]
write.table(data, file = "CspadeData.txt", sep = " ", row.names = FALSE, col.names = FALSE)