根据分组数据中的特定条件筛选行-python_Python_Pandas

根据分组数据中的特定条件筛选行-python

python pandas

根据分组数据中的特定条件筛选行-python,python,pandas,Python,Pandas,我有一个数据，其中的数据被分组在一起，但在我的最终输出中，我只需要输出满足条件的分组数据，即在分组数据中同时包含F和p值。仅包含F或P的分组将被丢弃。下表仅选择包含F和P的b_名称。从表XXXX中选择ZZZZ和BBBB，其他不选择输入输出您可以按列b_name分组，然后使用仅保留那些同时在p_F列中具有F和p值的组（对于每个组）。接下来，使用drop_duplicates（“b_name”）删除重复的行，并将p_f设置为所需的输出将熊猫作为pd导入 df=pd.read_csv（“sa

我有一个数据，其中的数据被分组在一起，但在我的最终输出中，我只需要输出满足条件的分组数据，即在分组数据中同时包含F和p值。仅包含F或P的分组将被丢弃。下表仅选择包含F和P的b_名称。从表XXXX中选择ZZZZ和BBBB，其他不选择

输入

输出

您可以按列

b_name

分组，然后使用仅保留那些同时在

p_F

列中具有

和

值的组（对于每个组）。接下来，使用

drop_duplicates（“b_name”）

删除重复的行，并将

p_f

设置为所需的输出

将熊猫作为pd导入
df=pd.read_csv（“sample.csv”，sep=“；”）
打印（df）
df_group=df.groupby（“b_名称”）
df_过滤器=df_组过滤器（λx:
（x.p_F.值中的“F”）和（x.p_F.值中的“p”）
)
df_filter=df_filter.删除重复项（“b_名称”）
df_过滤器[“p_f”]=“FP”
打印（df_过滤器[[“b_id”、“b_名称”、“p_f”]]）

来自df_滤波器的输出

    b_id b_name p_f
0  29743   XXXX  FP
3  29751   ZZZZ  FP
6  30832   BBBB  FP