R 总结、ggplot2和方差分析问题_R_Ggplot2

R 总结、ggplot2和方差分析问题

R 总结、ggplot2和方差分析问题,r,ggplot2,R,Ggplot2,我收到了大量的数据集，工作了12个小时后，我感到绝望地迷失了方向数据：在三种不同温度下饲养的3400只实验室蜗牛的外壳测量结果。来自3个城市，以及这些城市内的2个栖息地因变量=连续变量；蜗牛壳尺寸（单位：厘米）（n=~3400）自变量=城市（基拉戈、迈阿密、杰克逊维尔）、栖息地（沼泽或海滩）和饲养温度（26、28或30摄氏度）随机效应=蜗牛群体（n=~200）假设：海滩的贝壳比沼泽大壳体尺寸随纬度的增加而减小我在ggplot2中需要做什么：在x轴上绘制3个温度，

我收到了大量的数据集，工作了12个小时后，我感到绝望地迷失了方向

数据：

在三种不同温度下饲养的3400只实验室蜗牛的外壳测量结果。来自3个城市，以及这些城市内的2个栖息地
因变量=连续变量；蜗牛壳尺寸（单位：厘米）（n=~3400）
自变量=城市（基拉戈、迈阿密、杰克逊维尔）、栖息地（沼泽或海滩）和饲养温度（26、28或30摄氏度）
- 随机效应=蜗牛群体（n=~200）

假设：

海滩的贝壳比沼泽大
壳体尺寸随纬度的增加而减小

我在ggplot2中需要做什么：

在x轴上绘制3个温度，在y轴上绘制外壳尺寸
用误差条绘制每组的平均值
划出一条线连接组的意思
在同一图表上有两条或三条线

我需要做的统计工作：

对上述两个假设和其他潜在关系进行测试，得出p值

我试图得到的东西意味着什么和SE:

使用此代码时，我只得到一个“+”号：

summarySE <- function(data=NULL, measurevar, groupvars=NULL, na.rm=FALSE, 
conf.interval=.95, .drop=TRUE) {
require(plyr) #New version of length which can handle NA's: if na.rm==T, 
don't count them
length2 <- function (x, na.rm=FALSE) {
if (na.rm) sum(!is.na(x))
else       length(x)
}

# This is does the summary; it's not easy to understand...
datac <- ddply(data, groupvars, .drop=.drop,
           .fun= function(xx, col, na.rm) {
                   c( N    = length2(xx[,col], na.rm=na.rm),
                      mean = mean   (xx[,col], na.rm=na.rm),
                      sd   = sd     (xx[,col], na.rm=na.rm)
                      )
                  },
            measurevar,
            na.rm
     )

但我无法连接方法，添加SE，或设置最佳匹配线

我尝试过的分析：

我制作了一个混合效果模型：

    model <- lme(shell.size ~habitat * temp *city, random = ~1|colony, data = FL.snails)

但我不知道这是否验证了我的假设

有这么多的关系和等级制度，让我头晕目眩。有2个栖息地，3个城市，3个临时工，我被所有可能的测试组合弄得不知所措

如果您对以上任何一项有任何帮助，我们将不胜感激。我真的很难过

以下是缩写的

dput

    28L, 28L,....., 28L, 26L,...... 26L, 26L, 30L,...... 30L, ..........0.683, 1.283)), .Names = c("colony", "individual", "city", "habitat", "temp", "shell.size"), class = "data.frame", row.names = c(NA, -5471L))

等等，您是否尝试在模型上运行summary（）

如果您试图将系数拉入单个TIBLE，那么来自broom包的tidy（）也可能会派上用场

也许这对你有帮助？

堆栈溢出是针对特定编程问题的，它不是一般建议的讨论论坛。试着编辑你的帖子，问一个特定的问题（选择建模或绘图——另一个作为单独的问题发布）。此外，在寻求帮助时，您应该包括一个简单的示例输入和所需的输出，可用于测试和验证可能的解决方案（“缩写”dput并没有真正的帮助）。我试图帮助您改进您的问题，以便您可以得到答案。编辑以关注一个特定问题。我们可以帮助你们，但我们不会只是为你们做一些像作业这样的大作业。不要气馁，试着编辑你的帖子。为你的挫折感到抱歉。看起来你有一个丰富有趣的数据集。做探索性的绘图和模型可能需要更多的时间。在我的工作中，我可能会花两周的时间来处理这种类型的数据集。另外，我希望你能耐心地学习ggplot2。我花了好几个月的时间才变得流利，但这是值得的。谢谢你们的建议和鼓励。我对R感到非常沮丧和不耐烦，但从那以后我花了相当多的时间在R工作，并且能够完成我计划要做的事情。谢谢你的帮助。我使用summary（），它给了我很多值，但没有考虑不同的温度处理。我将阅读该链接；看起来信息不错。谢谢你，我想你知道些什么了。我将温度改为因子（显然，当我调用“is.factor”时，它们不是因子），当我点击summary（）时，我得到了各种p值和关系。你让我意识到温度并不是所有时间的因素。我认为这给我带来了问题。@RichardGourderton希望你能理解“因素”和“连续性”之间的区别。我想知道把温度作为一个因素编码是否合法？从概念上讲，因子是具有有限数量不同值的变量；这类变量通常被称为分类变量。

    anova(model, type = 'marginal')

    28L, 28L,....., 28L, 26L,...... 26L, 26L, 30L,...... 30L, ..........0.683, 1.283)), .Names = c("colony", "individual", "city", "habitat", "temp", "shell.size"), class = "data.frame", row.names = c(NA, -5471L))