Pandas 带有数据帧的loc功能警告_Pandas

Pandas 带有数据帧的loc功能警告

pandas

Pandas 带有数据帧的loc功能警告,pandas,Pandas,在处理SO问题时，我遇到了一个使用withloc的警告错误，具体细节如下：数据帧示例：第一个数据帧df1: >>> data1 = {'Sample': ['Sample_A','Sample_D', 'Sample_E'], ... 'Location': ['Bangladesh', 'Myanmar', 'Thailand'], ... 'Year':[2012, 2014, 2015]} >>> df1 = pd.

在处理SO问题时，我遇到了一个使用with

loc

的警告错误，具体细节如下：

数据帧示例：

第一个数据帧df1:

>>> data1 = {'Sample': ['Sample_A','Sample_D', 'Sample_E'],
...         'Location': ['Bangladesh', 'Myanmar', 'Thailand'],
...         'Year':[2012, 2014, 2015]}

>>> df1 = pd.DataFrame(data1)
>>> df1.set_index('Sample')
            Location  Year
Sample
Sample_A  Bangladesh  2012
Sample_D     Myanmar  2014
Sample_E    Thailand  2015

>>> data2 = {'Num': ['Value_1','Value_2','Value_3','Value_4','Value_5'],
...         'Sample_A': [0,1,0,0,1],
...         'Sample_B':[0,0,1,0,0],
...         'Sample_C':[1,0,0,0,1],
...         'Sample_D':[0,0,1,1,0]}
>>> df2 = pd.DataFrame(data2)
>>> df2.set_index('Num')
         Sample_A  Sample_B  Sample_C  Sample_D
Num
Value_1         0         0         1         0
Value_2         1         0         0         0
Value_3         0         1         0         1
Value_4         0         0         0         1
Value_5         1         0         1         0


>>> samples
['Sample_A', 'Sample_D', 'Sample_E']

第二数据帧df2:

>>> data1 = {'Sample': ['Sample_A','Sample_D', 'Sample_E'],
...         'Location': ['Bangladesh', 'Myanmar', 'Thailand'],
...         'Year':[2012, 2014, 2015]}

>>> df1 = pd.DataFrame(data1)
>>> df1.set_index('Sample')
            Location  Year
Sample
Sample_A  Bangladesh  2012
Sample_D     Myanmar  2014
Sample_E    Thailand  2015

>>> data2 = {'Num': ['Value_1','Value_2','Value_3','Value_4','Value_5'],
...         'Sample_A': [0,1,0,0,1],
...         'Sample_B':[0,0,1,0,0],
...         'Sample_C':[1,0,0,0,1],
...         'Sample_D':[0,0,1,1,0]}
>>> df2 = pd.DataFrame(data2)
>>> df2.set_index('Num')
         Sample_A  Sample_B  Sample_C  Sample_D
Num
Value_1         0         0         1         0
Value_2         1         0         0         0
Value_3         0         1         0         1
Value_4         0         0         0         1
Value_5         1         0         1         0


>>> samples
['Sample_A', 'Sample_D', 'Sample_E']

当我采集

样本时

会按如下方式保留列，但同时会产生警告

>>> df3 = df2.loc[:, samples]
>>> df3
   Sample_A  Sample_D  Sample_E
0         0         0       NaN
1         1         0       NaN
2         0         1       NaN
3         0         1       NaN
4         1         0       NaN

警告:

想知道如何更好地处理这个问题

像这样使用：

或者，如果只需要相交的柱，请使用：

df3 = df2[df2.columns.intersection(samples)]
#alternative
#df3 = df2[np.intersect1d(df2.columns, samples)]
print (df3)
   Sample_A  Sample_D
0         0         0
1         1         0
2         0         1
3         0         1
4         1         0