R拟合准则中新数据帧的建立

R拟合准则中新数据帧的建立,r,dataframe,R,Dataframe,所以我有六个大数据集,每个数据集都有大约250个预测值(每个预测值的初始值都相同)。如果预测值不符合特定标准,则运行一种算法,从数据集中删除预测值 例如,有一个叫做X.50T的预测器 可以从第一个数据集和第二个数据集中删除X.50T,但不能从其他数据集中删除。所有其他预测因子也是如此 我想知道我的六个数据集中都包含哪些预测因子 如何在R中实现这一点 本质上,每个数据集对应的是一个结果列($d{i}$) 也就是说,我有六列数据集,$d{1}$,$d{2}$,$d{3}$,$d{4}$,$d{5}$

所以我有六个大数据集,每个数据集都有大约250个预测值(每个预测值的初始值都相同)。如果预测值不符合特定标准,则运行一种算法,从数据集中删除预测值

例如,有一个叫做X.50T的预测器

可以从第一个数据集和第二个数据集中删除X.50T,但不能从其他数据集中删除。所有其他预测因子也是如此

我想知道我的六个数据集中都包含哪些预测因子

如何在R中实现这一点

本质上,每个数据集对应的是一个结果列($d{i}$)

也就是说,我有六列数据集,$d{1}$,$d{2}$,$d{3}$,$d{4}$,$d{5}$和$d{6}$

我想创建一个新的数据框,其中包含上述六列和预测器,但只包含在所有六个数据集中出现的预测器

六个数据集中的每一个都有1800-2000行。每个都对应于行名称。我还只想将这一观察结果出现在所有六行中的那些行包括在内。例如,数据帧有“row.names”1,2,3…2000,中间缺少一些。如果我在所有六个数据集中都有对应于行名“150”的观察值,我想包括,如果哪怕一个数据集中缺少,我想排除

例如,假设在250个预测值中,只有200个出现在所有六个数据集中。观测数量约为2000次。所以我想要一个2000乘206的矩阵作为我的新数据帧。但我只想在行中包含所有六个数据中出现的数据,所以它可能是一个更小的数据帧,比如1800 x 206


感谢

要获取数据帧的列名,请先使用
名称
colnames
,如中所示

cols <- colnames(df)
要很好地处理多个向量的列名,请尝试
Reduce

third <- fourth <- fifth <- sixth <- first[-1]
third
[1] "Flat White" "Americano" 

final_columns <- Reduce(intersect, list(first, second, third, fourth, fifth, sixth))
final_columns 
[1] "Americano"
完成此操作后,只需将原始数据帧子集:

newdf <- original_df[, final_columns]
newdf请阅读,以帮助被帮助。
final_columns <- c("Bulletproof Coffee", final_columns)
newdf <- original_df[, final_columns]