Python 与大熊猫和熊猫的动态比较_Python_Pandas

Python 与大熊猫和熊猫的动态比较

python pandas

Python 与大熊猫和熊猫的动态比较,python,pandas,Python,Pandas,我有一个字典，每个列都是数据帧中的一个键，比如： dict = {"colA":1,"colB":1,"colC":1} 使用colA、colB、colC，我的数据帧的列将被删除我想做一些类似的事情： df.loc[(df["colA"] < = dict["colA"]) & (df["colB"] < = dict["colB"]) & (df["colC"] < = dict["colC"])] df.loc[（df[“colA”]

我有一个字典，每个列都是

数据帧中的一个键，比如：
dict = {"colA":1,"colB":1,"colC":1}

使用colA、colB、colC，我的数据帧的列将被删除
我想做一些类似的事情：
df.loc[(df["colA"] < = dict["colA"]) & (df["colB"] < = dict["colB"]) & (df["colC"] < = dict["colC"])]

df.loc[（df[“colA”]<=dict[“colA”]）和（df[“colB”]<=dict[“colB”]）和（df[“colC”]<=dict[“colC”]）]

但是动态地（我不知道dict的长度/列数）
是否有一种方法可以使用动态数量的参数执行&
？
您可以使用：
from  functools import reduce

df = pd.DataFrame({'colA':[1,2,0],
                   'colB':[0,5,6],
                   'colC':[1,8,9]})

print (df)
   colA  colB  colC
0     1     0     1
1     2     5     8
2     0     6     9

d = {"colA":1,"colB":1,"colC":1}

a = df[(df["colA"] <= d["colA"]) & (df["colB"] <= d["colB"]) & (df["colC"] <= d["colC"])]
print (a)
   colA  colB  colC
0     1     0     1

另一种解决方案是使用andreduce
创建遮罩，并使用列表理解
创建应用条件：
print ([df[x] <= d[x] for x in df.columns])
[0     True
1    False
2     True
Name: colA, dtype: bool, 0     True
1    False
2    False
Name: colB, dtype: bool, 0     True
1    False
2    False
Name: colC, dtype: bool]

mask = reduce(np.logical_and, [df[x] <= d[x] for x in df.columns])
print (mask)
0     True
1    False
2    False
Name: colA, dtype: bool

print (df[mask])
   colA  colB  colC
0     1     0     1

print（[df[x]这里有一个类似SQL的解决方案，它使用以下方法：
数据：
解决方案：
In [20]: dct = {"colA":4,"colB":4,"colC":4}

In [21]: qry = ' and '.join(('{0[0]} <= {0[1]}'.format(tup) for tup in dct.items()))

In [22]: qry
Out[22]: 'colB <= 4 and colA <= 4 and colC <= 4'

In [24]: df.query(qry)
Out[24]:
   colA  colB  colC
3     3     0     2
7     0     4     1

[20]中的dct={“colA”：4，“colB”：4，“colC”：4}
在[21]中：qry='and'.join（{0[0]}
In [23]: df
Out[23]:
   colA  colB  colC
0     2     2     5
1     3     0     8
2     5     9     2
3     3     0     2
4     9     1     3
5     7     5     6
6     7     8     0
7     0     4     1
8     8     2     6
9     9     6     7

In [20]: dct = {"colA":4,"colB":4,"colC":4}

In [21]: qry = ' and '.join(('{0[0]} <= {0[1]}'.format(tup) for tup in dct.items()))

In [22]: qry
Out[22]: 'colB <= 4 and colA <= 4 and colC <= 4'

In [24]: df.query(qry)
Out[24]:
   colA  colB  colC
3     3     0     2
7     0     4     1