R 独立二进制变量(频率)和连续响应变量-lmm

R 独立二进制变量(频率)和连续响应变量-lmm,r,R,我花了很多时间寻找解决方案,但没有成功。出于这个原因,我决定把我的问题贴在这里,希望你们中的某个人能帮助我 我想找出哪些变量影响两种动物(同一物种)的旅行距离 响应变量为移动距离(以米为单位)。我总共为这两种动物进行了66次追踪 自变量为:温度、降雨量、后代(是=1,否=0)、观察期(分钟)和活动 我每15分钟观察一次动物(一天一只),并记录活动状态(活动=1或不活动=0)。因此,我的数据表由大约1800个点和相同数量的活动记录组成 然后,我创建了一个包含以下列的表: Animal, Track

我花了很多时间寻找解决方案,但没有成功。出于这个原因,我决定把我的问题贴在这里,希望你们中的某个人能帮助我

我想找出哪些变量影响两种动物(同一物种)的旅行距离

响应变量为移动距离(以米为单位)。我总共为这两种动物进行了66次追踪

自变量为:温度、降雨量、后代(是=1,否=0)、观察期(分钟)和活动

我每15分钟观察一次动物(一天一只),并记录活动状态(活动=1或不活动=0)。因此,我的数据表由大约1800个点和相同数量的活动记录组成

然后,我创建了一个包含以下列的表:

Animal, Tracking-Session, rainfall, offspring, observation period, active, inactive, distance
两列
active
inactive
包含每个跟踪会话的活动(非活动)记录的总和

例如,在跟踪会话1中,动物A活动30倍,非活动11倍,并在跟踪会话期间移动6000米

我想我可以使用命令
cbind()
对这个表进行分析,从两列中选择一列作为“非活动”和“活动”。但这不起作用,我得到:

Error in lme4::lFormula(formula = distance~ (1 | animal) + activity + offspring + ...
  rank of X = 12 < ncol(X) = 13
lme4中的错误::lFormula(公式=距离~(1 |动物)+活动+后代+。。。 X=12 我想将第二个动物作为随机因子,以获得对整个“群体”(在这种情况下,只有两个动物)有效的输出

我如何将一个线性混合模型与这些数据相匹配,或者第一个问题是:我的数据表如何进行这样的分析

我开始运行一个线性混合模型,我的原始数据表由1800行组成,但结果并不令人信服。我不知道这个表是否为这项任务正确构建。因为我只有60个跟踪会话,因此只有60个结果行程,但有1800条活动记录(每15分钟-活动或非活动)。我不知道如何处理这种情况。我克服这个问题的唯一可能性是复制行程距离(这是每天观察的所有点的结果),并将其分配给跟踪会话的每个点

降雨量和温度也是一样,因为这些条件一天只测量一次,我必须复制同一天每个点的值。 这是正确的还是更好的方法可以处理这样的表(如图中所示)?还是最好创建一个每天一行的表(如我上面所述)? 如果第二个表(每个跟踪会话有一行的表)是更好的选择,那么如何转换为R可以使用它

希望你能理解我的解释(我尽量详细地解释),任何人都能帮助我

提前谢谢!
Iris

cbind
不生成一列。可能有几种方法可以将活动数据聚合为一个变量。例如,您可以计算
活动/(活动+非活动)
。感谢您的评论-我将使用每天的活动时间(acive/(acive+非活动),但如果我这样做的话……活动是一个比例(活动时间/观察时间)R对比例的处理方式是否不同?或者我可以像使用任何其他数值一样使用比例值吗?
lme4
可以将比例作为一个预测值处理得很好。如果假设与比例成线性关系是有意义的,我无法在没有(a)您的数据和/或(b)的情况下告诉您更好地理解科学。然而,这只是一个例子。如何将这些变量组合成一个变量取决于您。原则上,您应该能够使用逻辑回归来处理这个问题(使用原始的二进制响应变量和
glmer(…,family=“binomial”)
。将其建模为二项式(如您所做的那样按天聚合)也是合理的,不过在这种情况下,您可能需要考虑过度分散。这将成为一个更适合交叉验证的问题。。。