Warning: file_get_contents(/data/phpspider/zhask/data//catemap/6/apache/8.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R 差异分析和加权序列数据:我在哪里找到我的组变量?_R_Traminer - Fatal编程技术网

R 差异分析和加权序列数据:我在哪里找到我的组变量?

R 差异分析和加权序列数据:我在哪里找到我的组变量?,r,traminer,R,Traminer,我正在尝试差异分析。由于序列数据的大容量,我将权重与WeightedCluster包一起使用。在到达实际的disassoc()部分之前,一切都很顺利。我似乎无法找到我的组变量 我试着紧跟WeightedCluster手册和Studer等人2011年的文章中的例子。这篇文章很有用,并帮助我向前迈进,但我不知道如何在disassoc()参数中找到这些单独的组变量。假设我使用的是相同的示例数据(虽然我的原始数据没有采样权重),但我只能使用聚合数据: ## Aggregate example data

我正在尝试差异分析。由于序列数据的大容量,我将权重与WeightedCluster包一起使用。在到达实际的
disassoc()
部分之前,一切都很顺利。我似乎无法找到我的组变量

我试着紧跟WeightedCluster手册和Studer等人2011年的文章中的例子。这篇文章很有用,并帮助我向前迈进,但我不知道如何在
disassoc()
参数中找到这些单独的组变量。假设我使用的是相同的示例数据(虽然我的原始数据没有采样权重),但我只能使用聚合数据:

## Aggregate example data
mvad.agg <- wcAggregateCases(mvad[, c(10:12, 17:86)], weights=mvad$weight)
mvad.agg

## Define sequence object 
mvad.agg.seq <- seqdef(mvad[mvad.agg$aggIndex, 17:86], alphabet=mvad.alphabet,
                       states=mvad.scodes, labels=mvad.labels,
                       weights=mvad.agg$aggWeights)

## Computing OM dissimilarities
mvad.agg.dist <- seqdist(mvad.agg.seq, method="OM", indel=1.5, sm="CONSTANT")

## Discrepancy analysis
dissassoc (mvad.agg.dist, group = mvad$gcse5eq, weights = mvad.agg$aggWeights, weight.permutation = "replicate")
##聚合示例数据

mvad.agg首先,您需要在提供给
wcAggregateCases
的表格中包含您的协变量。(此处
gcse5eq
mvad
的第12列,已经属于
mvad[,c(10:12,17:86)]

然后,您必须作为
group
变量提供与
wcAggregateCases
选择的病例对应的协变量值。您可以通过
$aggIndex
实现这一点。我举例说明如下:

library(TraMineR) 
library(WeightedCluster) 
## Load example data and assign labels
data(mvad)
mvad.alphabet <- c("employment", "FE", "HE", "joblessness", "school", "training")
mvad.labels <- c("Employment", "Further Education", "Higher Education", 
                 "Joblessness", "School", "Training")
mvad.scodes <- c("EM", "FE", "HE", "JL", "SC", "TR")
## Aggregate example data
mvad.agg <- wcAggregateCases(mvad[, c(10:12, 17:86)], weights=mvad$weight)
## Define the sequence object 
mvad.agg.seq <- seqdef(mvad[mvad.agg$aggIndex, 17:86], alphabet=mvad.alphabet,
                       states=mvad.scodes, labels=mvad.labels,
                       weights=mvad.agg$aggWeights)
## Computing OM dissimilarities
mvad.agg.dist <- seqdist(mvad.agg.seq, method="OM", indel=1.5, sm="CONSTANT")
## Discrepancy analysis
dissassoc (mvad.agg.dist, group = mvad$gcse5eq[mvad.agg$aggIndex], 
           weights = mvad.agg$aggWeights, 
           weight.permutation = "random-sampling")
库(TraMineR)
图书馆(加权集群)
##加载示例数据并指定标签
数据(mvad)

欢迎来到堆栈溢出!问题应该是独立的。为了提供,请编辑它:1.)指定您使用的所有库,2.)@jay.sf库、从
TraMineR
加载
mvad
数据以及
mvad的定义。seq
在问题中引用的帖子中。我修复了这里提供的代码示例中的打字错误。