格式化时间戳以避免R/TraMineR崩溃?
我有一个序列数据集,其中时间戳是从历元开始的秒数:格式化时间戳以避免R/TraMineR崩溃?,r,traminer,R,Traminer,我有一个序列数据集,其中时间戳是从历元开始的秒数: id event time end 1 723 opened 1356963741 1356963741 2 722 opened 1356931342 1356931342 3 721 referenced 1356988206 1356988206 4 721 referenced 1356988186 1356988186 5 721 closed 1356988186
id event time end
1 723 opened 1356963741 1356963741
2 722 opened 1356931342 1356931342
3 721 referenced 1356988206 1356988206
4 721 referenced 1356988186 1356988186
5 721 closed 1356988186 1356988186
6 721 merged 1356988186 1356988186
7 721 closed 1356988186 1356988186
8 721 merged 1356988186 1356988186
9 721 discussed 1356966433 1356966433
10 721 discussed 1356963870 1356963870
我想创建一个STS
sequence对象:
sequences.sts <- seqformat(data, from="SPELL", to="STS",
begin="time", end="end", id="id", status="event", limit=slmax)
sequences.sts <- seqdef(sequences.sts)
summary(sequences.sts)
sequences.sts我无法重现这个问题,但最可能的原因是它会产生很长的序列。序列721持续24'336秒。换句话说,我们应该创建一个长度为24'336的序列。根据序列和其他序列的数量,计算时间将非常长
问题是我们使用时间戳的时间单位(秒)。您可以尝试使用另一个时间单位,可能会聚合在同一时间单位发生的事件
希望这能有所帮助。我还可以将时间戳简化为简单的排序,比如:我是否应该期望这种方法会产生明显的偏差?或者,如果我只计算基于事件顺序的序列统计信息,而不一定是持续时间,这是否可以呢?这两种方法都有意义。你应该根据你的研究问题来选择。