R 独立二进制变量（频率）和连续响应变量-lmm_R

R 独立二进制变量（频率）和连续响应变量-lmm

R 独立二进制变量（频率）和连续响应变量-lmm,r,R,我花了很多时间寻找解决方案，但没有成功。出于这个原因，我决定把我的问题贴在这里，希望你们中的某个人能帮助我我想找出哪些变量影响两种动物（同一物种）的旅行距离响应变量为移动距离（以米为单位）。我总共为这两种动物进行了66次追踪自变量为：温度、降雨量、后代（是=1，否=0）、观察期（分钟）和活动我每15分钟观察一次动物（一天一只），并记录活动状态（活动=1或不活动=0）。因此，我的数据表由大约1800个点和相同数量的活动记录组成然后，我创建了一个包含以下列的表： Animal, Track

我花了很多时间寻找解决方案，但没有成功。出于这个原因，我决定把我的问题贴在这里，希望你们中的某个人能帮助我

我想找出哪些变量影响两种动物（同一物种）的旅行距离

响应变量为移动距离（以米为单位）。我总共为这两种动物进行了66次追踪

自变量为：温度、降雨量、后代（是=1，否=0）、观察期（分钟）和活动

我每15分钟观察一次动物（一天一只），并记录活动状态（活动=1或不活动=0）。因此，我的数据表由大约1800个点和相同数量的活动记录组成

然后，我创建了一个包含以下列的表：

Animal, Tracking-Session, rainfall, offspring, observation period, active, inactive, distance

两列

active

和

inactive

包含每个跟踪会话的活动（非活动）记录的总和

例如，在跟踪会话1中，动物A活动30倍，非活动11倍，并在跟踪会话期间移动6000米

我想我可以使用命令

cbind（）

对这个表进行分析，从两列中选择一列作为“非活动”和“活动”。但这不起作用，我得到：

Error in lme4::lFormula(formula = distance~ (1 | animal) + activity + offspring + ...
  rank of X = 12 < ncol(X) = 13

lme4中的错误：：lFormula（公式=距离~（1 |动物）+活动+后代+。。。 X=12 我想将第二个动物作为随机因子，以获得对整个“群体”（在这种情况下，只有两个动物）有效的输出

我如何将一个线性混合模型与这些数据相匹配，或者第一个问题是：我的数据表如何进行这样的分析

我开始运行一个线性混合模型，我的原始数据表由1800行组成，但结果并不令人信服。我不知道这个表是否为这项任务正确构建。因为我只有60个跟踪会话，因此只有60个结果行程，但有1800条活动记录（每15分钟-活动或非活动）。我不知道如何处理这种情况。我克服这个问题的唯一可能性是复制行程距离（这是每天观察的所有点的结果），并将其分配给跟踪会话的每个点

降雨量和温度也是一样，因为这些条件一天只测量一次，我必须复制同一天每个点的值。这是正确的还是更好的方法可以处理这样的表（如图中所示）？还是最好创建一个每天一行的表（如我上面所述）？如果第二个表（每个跟踪会话有一行的表）是更好的选择，那么如何转换为R可以使用它

希望你能理解我的解释（我尽量详细地解释），任何人都能帮助我

提前谢谢！

Iris

cbind

不生成一列。可能有几种方法可以将活动数据聚合为一个变量。例如，您可以计算

活动/（活动+非活动）

。感谢您的评论-我将使用每天的活动时间（acive/（acive+非活动），但如果我这样做的话……活动是一个比例（活动时间/观察时间）R对比例的处理方式是否不同？或者我可以像使用任何其他数值一样使用比例值吗？

lme4

可以将比例作为一个预测值处理得很好。如果假设与比例成线性关系是有意义的，我无法在没有（a）您的数据和/或（b）的情况下告诉您更好地理解科学。然而，这只是一个例子。如何将这些变量组合成一个变量取决于您。原则上，您应该能够使用逻辑回归来处理这个问题（使用原始的二进制响应变量和

glmer（…，family=“binomial”）

。将其建模为二项式（如您所做的那样按天聚合）也是合理的，不过在这种情况下，您可能需要考虑过度分散。这将成为一个更适合交叉验证的问题。。。