在python中从两个不同的数据集中选择值

在python中从两个不同的数据集中选择值,python,pandas,list,dataset,Python,Pandas,List,Dataset,我在处理我的2数据集时遇到问题,我解释我的问题: 我有两个不同的数据集: training_df = pd.read_csv('.../train.csv') test_df = pd.read_csv('.../test.csv') 我必须从train.csv的某些列中获取值,并在test.csv中获取其他列的值,我尝试如下: num_attrib = pd.DataFrame(training_df, columns=[0, 2, 3, 15, 16, 17, 18, 24, 32, 34

我在处理我的2数据集时遇到问题,我解释我的问题:

我有两个不同的数据集:

training_df = pd.read_csv('.../train.csv')
test_df = pd.read_csv('.../test.csv')
我必须从train.csv的某些列中获取值,并在test.csv中获取其他列的值,我尝试如下:

num_attrib = pd.DataFrame(training_df, columns=[0, 2, 3, 15, 16, 17, 18, 24, 32, 34, 35, 36, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 52, 54, 57, 59, 60, 64, 65, 66, 67, 68, 69, 70, 71, 72])
cat_attrib = pd.DataFrame(training_df, columns=[1, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 19, 20, 21, 22, 23, 25, 26, 27, 28, 29, 30, 31, 33, 37, 38, 39, 40, 51, 53, 55, 56, 58, 61, 62, 63, 73, 74])

num_attrib_test = pd.DataFrame(test_df, columns=[0, 2, 3, 15, 16, 17, 18, 24, 32, 34, 35, 36, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 52, 54, 57, 59, 60, 64, 65, 66, 67, 68, 69, 70, 71, 72])
cat_attrib_test = pd.DataFrame(test_df, columns=[1, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 19, 20, 21, 22, 23, 25, 26, 27, 28, 29, 30, 31, 33, 37, 38, 39, 40, 51, 53, 55, 56, 58, 61, 62, 63, 73, 74])
两个数据集都有数字和分类数据。我必须为每个数据集选择分类数据和数字数据,但我的方法是错误的。 我遇到了这个问题,因为我必须在训练和测试中使用Columntransformer()。 有什么建议吗


非常感谢

您正在寻找
iloc

您还可以切片:

#even columns
num_attrib = training_df.iloc[:, ::2]
#odd columns
num_attrib = training_df.iloc[:, 1::2]

不清楚你在问什么。请包括示例输出您是否有一个源数据框,您正试图将其拆分为训练和测试数据?我编辑了我的帖子,也许现在更清楚了,我需要在训练和测试集上应用Columntransformer,因为当我进行fit_转换时,它不需要测试集上的分类数据
#even columns
num_attrib = training_df.iloc[:, ::2]
#odd columns
num_attrib = training_df.iloc[:, 1::2]