R拟合准则中新数据帧的建立_R_Dataframe

R拟合准则中新数据帧的建立

r dataframe

R拟合准则中新数据帧的建立,r,dataframe,R,Dataframe,所以我有六个大数据集，每个数据集都有大约250个预测值（每个预测值的初始值都相同）。如果预测值不符合特定标准，则运行一种算法，从数据集中删除预测值例如，有一个叫做X.50T的预测器可以从第一个数据集和第二个数据集中删除X.50T，但不能从其他数据集中删除。所有其他预测因子也是如此我想知道我的六个数据集中都包含哪些预测因子如何在R中实现这一点本质上，每个数据集对应的是一个结果列（$d{i}$）也就是说，我有六列数据集，$d{1}$，$d{2}$，$d{3}$，$d{4}$，$d{5}$

所以我有六个大数据集，每个数据集都有大约250个预测值（每个预测值的初始值都相同）。如果预测值不符合特定标准，则运行一种算法，从数据集中删除预测值

例如，有一个叫做X.50T的预测器

可以从第一个数据集和第二个数据集中删除X.50T，但不能从其他数据集中删除。所有其他预测因子也是如此

我想知道我的六个数据集中都包含哪些预测因子

如何在R中实现这一点

本质上，每个数据集对应的是一个结果列（$d{i}$）

也就是说，我有六列数据集，$d{1}$，$d{2}$，$d{3}$，$d{4}$，$d{5}$和$d{6}$

我想创建一个新的数据框，其中包含上述六列和预测器，但只包含在所有六个数据集中出现的预测器

六个数据集中的每一个都有1800-2000行。每个都对应于行名称。我还只想将这一观察结果出现在所有六行中的那些行包括在内。例如，数据帧有“row.names”1,2,3…2000，中间缺少一些。如果我在所有六个数据集中都有对应于行名“150”的观察值，我想包括，如果哪怕一个数据集中缺少，我想排除

例如，假设在250个预测值中，只有200个出现在所有六个数据集中。观测数量约为2000次。所以我想要一个2000乘206的矩阵作为我的新数据帧。但我只想在行中包含所有六个数据中出现的数据，所以它可能是一个更小的数据帧，比如1800 x 206

感谢

要获取数据帧的列名，请先使用

名称

或

colnames

，如中所示

cols <- colnames(df)

要很好地处理多个向量的列名，请尝试

Reduce

third <- fourth <- fifth <- sixth <- first[-1]
third
[1] "Flat White" "Americano" 

final_columns <- Reduce(intersect, list(first, second, third, fourth, fifth, sixth))
final_columns 
[1] "Americano"

完成此操作后，只需将原始数据帧子集：

newdf <- original_df[, final_columns]

newdf请阅读，以帮助被帮助。
final_columns <- c("Bulletproof Coffee", final_columns)

newdf <- original_df[, final_columns]