R中多数值列上的子集_R - Fatal编程技术网

R中多数值列上的子集

R中多数值列上的子集,r,R,我有3列数据，每列都有一个数字距离值我使用以下函数成功地为每个列创建了一个子集，以消除异常值： newData <- subset(x, x < mean(x)+3*sd(x) & x > mean(x)-3*sd(x)) newData平均值（x）-3*sd（x））问题是，这会创建三个不同长度的新向量，我想对处理过的数据进行t检验如何才能最好地创建所有三列的子集，其中条件之外的数据将被丢弃 x[使用（x，xmean（x）-3*sd（x）），]？为什么要删除异

我有3列数据，每列都有一个数字距离值

我使用以下函数成功地为每个列创建了一个子集，以消除异常值：

newData <- subset(x, x < mean(x)+3*sd(x) & x > mean(x)-3*sd(x))

newData平均值（x）-3*sd（x））

问题是，这会创建三个不同长度的新向量，我想对处理过的数据进行t检验

如何才能最好地创建所有三列的子集，其中条件之外的数据将被丢弃

x[使用（x，xmean（x）-3*sd（x）），]

？为什么要删除异常值？所以你想删除异常值，并且仍然有长度相等的向量？我认为你的方法没有很好的基础。如果这三列是独立的样本集，那么样本大小应该无关紧要。如果它们不是独立的，那么对不同的列应用不同的标准（即每列的

sd

）可能不是一个好主意。如果你能告诉我们你的数据集代表了什么，我们也许能够为你的实际问题提出一个更好的方法。我想删除异常值，以保证后面的t检验是重要的。数据表示在3个不同任务中到对象的距离。