Pandas 将数据从一个数据帧移动到另一个具有相同列的数据帧中
所以我仍然在看熊猫,在做这件事时有点麻烦 数据集1Pandas 将数据从一个数据帧移动到另一个具有相同列的数据帧中,pandas,python-3.5,Pandas,Python 3.5,所以我仍然在看熊猫,在做这件事时有点麻烦 数据集1 Sample Age Tumor Location 3 31 Benign Lung 8 45 Malignant Heart 9 44 Malignant Heart 数据集2 Sample Age Tumor Location 3 None None None 8 None None None
Sample Age Tumor Location
3 31 Benign Lung
8 45 Malignant Heart
9 44 Malignant Heart
数据集2
Sample Age Tumor Location
3 None None None
8 None None None
9 None None None
Sample Age Tumor Location
3 31 Benign Lung
8 45 Malignant Heart
9 44 Malignant Heart
我想要做的是根据样本列将数据从数据集1移动到数据集2,以便正确映射
像这样
数据集2
Sample Age Tumor Location
3 None None None
8 None None None
9 None None None
Sample Age Tumor Location
3 31 Benign Lung
8 45 Malignant Heart
9 44 Malignant Heart
我似乎还找不到这样的例子。除了将两者合并成一个新的数据帧之外 使用
update
并假设'Sample'
是map的唯一键
df2=df2.set_index('Sample')
df2.update(df1.set_index('Sample'))
df2.reset_index(inplace=True)
df2
Out[1046]:
Sample Age Tumor Location
0 3 31 Benign Lung
1 8 45 Malignant Heart
2 9 44 Malignant Heart
您可以使用
loc
()根据行上的条件设置列。下面是一个例子:
#Setup
import pandas as pd
dataset_1 = {
'Sample': [3, 8, 9],
'Age': [31, 45, 44],
'Tumor': ['Benign', 'Malignant', 'Malignant'],
'Location': ['Lung', 'Heart', 'Heart']
}
dataset_2 = {
'Sample': [3, 8, 9],
'Age': [None, None, None],
'Tumor': [None, None, None],
'Location': [None, None, None]
}
df_1 = pd.DataFrame(dataset_1)
df_2 = pd.DataFrame(dataset_2)
print(df_1)
print(df_2)
哪些产出:
Age Location Sample Tumor
0 31 Lung 3 Benign
1 45 Heart 8 Malignant
2 44 Heart 9 Malignant
Age Location Sample Tumor
0 None None 3 None
1 None None 8 None
2 None None 9 None
这是如何使用loc
将某列的行与另一列的行相等的列设置为相等。
在这种情况下,被比较的列是两个数据帧的Sample
列:
df_2.loc[df_2.Sample == df_1.Sample, :] = df_1
print(df_1)
print(df_2)
这给了我们:
Age Location Sample Tumor
0 31 Lung 3 Benign
1 45 Heart 8 Malignant
2 44 Heart 9 Malignant
Age Location Sample Tumor
0 31 Lung 3 Benign
1 45 Heart 8 Malignant
2 44 Heart 9 Malignant
我希望这就是你要找的。祝你好运