R T检验

R T检验,r,grouping,t-test,R,Grouping,T Test,我正在RStudio做一项作业,检查汽车品牌和碰撞安全等级之间的差异。现在我只想测试b/w福特和雪佛兰,但品牌类别还有20个品牌。 为了使用这些变量执行简单的T测试,我尝试了 t、 测试头_IC~make,可选=双面,成对=t 这给了我 分组因子必须正好有两个级别 我查看了一下堆栈,发现人们通常使用逗号来修复这个错误。我发现,如果我放置一个逗号b/w Head_IC并使我得到另一个单独的错误。我的问题是否带有我的x和y值?还是b/c由几个不同的品牌组成? 谢谢你的帮助 R使用所谓的方法来执行不同

我正在RStudio做一项作业,检查汽车品牌和碰撞安全等级之间的差异。现在我只想测试b/w福特和雪佛兰,但品牌类别还有20个品牌。 为了使用这些变量执行简单的T测试,我尝试了

t、 测试头_IC~make,可选=双面,成对=t

这给了我

分组因子必须正好有两个级别

我查看了一下堆栈,发现人们通常使用逗号来修复这个错误。我发现,如果我放置一个逗号b/w Head_IC并使我得到另一个单独的错误。我的问题是否带有我的x和y值?还是b/c由几个不同的品牌组成?
谢谢你的帮助

R使用所谓的方法来执行不同的行为,具体取决于给函数的对象类型

t、 测试头_IC~make,可选=双面,成对=t

不同于

t、 测试头集成电路,制造,可选=双面,成对=t

因为第一个接受公式参数,其中所有数值数据都在Head_IC中,所有类别数据都在make中。第二种形式假设第一组的所有数字数据都在Head_IC中,而第二组的所有数字数据都在make中

这是有益的,因为它允许您方便地获得相同的结果,即使您的数据可能有稍微不同的格式

不幸的是,正如您所发现的,您的数据的格式不适合使用t.test。有几种方法可以做到这一点

将数据子集 得到两个向量
解决问题的方法有很多种,您可能希望研究使用任何工具集对数据进行子集和转换的方法。

是的,您必须过滤数据框,使其仅包括您正在测试的两个级别。在这种情况下,过滤等于福特或雪佛兰的行。顺便说一下,这很可能不是配对T检验。非常感谢!将.csv更改为仅包含福特和雪佛兰,允许运行测试。你是对的,这是一个不成对的测试。为什么要使用配对测试?这是一个好问题…太好了!这真的很有帮助!谢谢你的全面回答!
data_subset <- your_data_object[your_data_object$make %in% c("Ford", "Chevrolet"), ]
t.test(Head_IC~make, alternative= "two.sided", paired=T, data = data_subset)
Ford <- your_data_object$Head_IC[your_data_object$make == "Ford"]
Chev <- your_data_object$Head_IC[your_data_object$make == "Chevrolet"]

t.test(Ford, Chev, alternative = "two.sided", paired = TRUE)