Python 与大熊猫和熊猫的动态比较

Python 与大熊猫和熊猫的动态比较,python,pandas,Python,Pandas,我有一个字典,每个列都是数据帧中的一个键,比如: dict = {"colA":1,"colB":1,"colC":1} 使用colA、colB、colC,我的数据帧的列将被删除 我想做一些类似的事情: df.loc[(df["colA"] < = dict["colA"]) & (df["colB"] < = dict["colB"]) & (df["colC"] < = dict["colC"])] df.loc[(df[“colA”]

我有一个字典,每个列都是
数据帧中的一个键,比如:

dict = {"colA":1,"colB":1,"colC":1}
使用colA、colB、colC,我的
数据帧的列将被删除

我想做一些类似的事情:

df.loc[(df["colA"] < = dict["colA"]) & (df["colB"] < = dict["colB"]) & (df["colC"] < = dict["colC"])]
df.loc[(df[“colA”]<=dict[“colA”])和(df[“colB”]<=dict[“colB”])和(df[“colC”]<=dict[“colC”])]
但是动态地(我不知道dict的长度/列数)

是否有一种方法可以使用动态数量的参数执行
&

您可以使用:

from  functools import reduce

df = pd.DataFrame({'colA':[1,2,0],
                   'colB':[0,5,6],
                   'colC':[1,8,9]})

print (df)
   colA  colB  colC
0     1     0     1
1     2     5     8
2     0     6     9

d = {"colA":1,"colB":1,"colC":1}

a = df[(df["colA"] <= d["colA"]) & (df["colB"] <= d["colB"]) & (df["colC"] <= d["colC"])]
print (a)
   colA  colB  colC
0     1     0     1
另一种解决方案是使用and
reduce
创建遮罩,并使用
列表理解
创建应用条件:

print ([df[x] <= d[x] for x in df.columns])
[0     True
1    False
2     True
Name: colA, dtype: bool, 0     True
1    False
2    False
Name: colB, dtype: bool, 0     True
1    False
2    False
Name: colC, dtype: bool]

mask = reduce(np.logical_and, [df[x] <= d[x] for x in df.columns])
print (mask)
0     True
1    False
2    False
Name: colA, dtype: bool

print (df[mask])
   colA  colB  colC
0     1     0     1

print([df[x]这里有一个类似SQL的解决方案,它使用以下方法:

数据:

解决方案:

In [20]: dct = {"colA":4,"colB":4,"colC":4}

In [21]: qry = ' and '.join(('{0[0]} <= {0[1]}'.format(tup) for tup in dct.items()))

In [22]: qry
Out[22]: 'colB <= 4 and colA <= 4 and colC <= 4'

In [24]: df.query(qry)
Out[24]:
   colA  colB  colC
3     3     0     2
7     0     4     1
[20]中的
dct={“colA”:4,“colB”:4,“colC”:4}
在[21]中:qry='and'.join({0[0]}
In [23]: df
Out[23]:
   colA  colB  colC
0     2     2     5
1     3     0     8
2     5     9     2
3     3     0     2
4     9     1     3
5     7     5     6
6     7     8     0
7     0     4     1
8     8     2     6
9     9     6     7
In [20]: dct = {"colA":4,"colB":4,"colC":4}

In [21]: qry = ' and '.join(('{0[0]} <= {0[1]}'.format(tup) for tup in dct.items()))

In [22]: qry
Out[22]: 'colB <= 4 and colA <= 4 and colC <= 4'

In [24]: df.query(qry)
Out[24]:
   colA  colB  colC
3     3     0     2
7     0     4     1