R t在因子的多个级别上进行测试
我试图在r中对我的数据集执行多个t-test,但完全被apply函数、aggregate和for循环的功能搞糊涂了。 我的数据如下:我有不同产品的观察结果。对于每个产品,我都有多个数值变量,我想比较一下。此外,我有13种不同类别的产品。另外,我还有另一个因素变量,用于区分新产品、旧产品和旧产品。因此,我的数据样本如下所示:R t在因子的多个级别上进行测试,r,R,我试图在r中对我的数据集执行多个t-test,但完全被apply函数、aggregate和for循环的功能搞糊涂了。 我的数据如下:我有不同产品的观察结果。对于每个产品,我都有多个数值变量,我想比较一下。此外,我有13种不同类别的产品。另外,我还有另一个因素变量,用于区分新产品、旧产品和旧产品。因此,我的数据样本如下所示: ProdID Category Cond No. of instances Sales Time since launch aaaaa Sport
ProdID Category Cond No. of instances Sales Time since launch
aaaaa Sports New 100 40000 30
bbbb Crafts New 0 0 20
ccccc Music Used 20 1000 10
我的目标是执行以下操作,我想分别输出每个类别(体育、手工艺、音乐等)的t检验结果。这个t检验应该比较每个数值var的均值,“新”均值与“用过”均值的比较(我对“旧”值一点也不感兴趣)。所以在最后我想看看“上市以来的时间”m“销售”和“Num实例”在新旧运动、手工艺、音乐等方面的比较
我试过很多种方法,但每种方法(aggreagte,tapply,for loop)我都有不同的问题。。。似乎我在这里遗漏了一些东西(我在R是一个新手。我以前在spss中做这件事,并使用分割文件…出于某种原因,我的表没有按我希望的方式发布,我的想法是我有以下列:prodID、Category、Cond,。。。我加了一些例子:aaa,bbbb,ccc作为观察的例子…你提出的统计方法有很大的缺陷。我劝你联系一位统计学家。你真的不能用t检验来比较计数数据。然后是多重测试问题。谢谢,但这只是一个简化我的需求的例子。我的真实数据由多个连续变量组成,但解释起来要复杂得多。。。请把它们看作是连续的,实际上它们确实是这样的。