R中多数值列上的子集

R中多数值列上的子集,r,R,我有3列数据,每列都有一个数字距离值 我使用以下函数成功地为每个列创建了一个子集,以消除异常值: newData <- subset(x, x < mean(x)+3*sd(x) & x > mean(x)-3*sd(x)) newData平均值(x)-3*sd(x)) 问题是,这会创建三个不同长度的新向量,我想对处理过的数据进行t检验 如何才能最好地创建所有三列的子集,其中条件之外的数据将被丢弃 x[使用(x,xmean(x)-3*sd(x)),]?为什么要删除异

我有3列数据,每列都有一个数字距离值

我使用以下函数成功地为每个列创建了一个子集,以消除异常值:

newData <- subset(x, x < mean(x)+3*sd(x) & x > mean(x)-3*sd(x))
newData平均值(x)-3*sd(x))
问题是,这会创建三个不同长度的新向量,我想对处理过的数据进行t检验


如何才能最好地创建所有三列的子集,其中条件之外的数据将被丢弃

x[使用(x,xmean(x)-3*sd(x)),]
?为什么要删除异常值?所以你想删除异常值,并且仍然有长度相等的向量?我认为你的方法没有很好的基础。如果这三列是独立的样本集,那么样本大小应该无关紧要。如果它们不是独立的,那么对不同的列应用不同的标准(即每列的
sd
)可能不是一个好主意。如果你能告诉我们你的数据集代表了什么,我们也许能够为你的实际问题提出一个更好的方法。我想删除异常值,以保证后面的t检验是重要的。数据表示在3个不同任务中到对象的距离。