根据分组数据中的特定条件筛选行-python
我有一个数据,其中的数据被分组在一起,但在我的最终输出中,我只需要输出满足条件的分组数据,即在分组数据中同时包含F和p值。仅包含F或P的分组将被丢弃。下表仅选择包含F和P的b_名称。从表XXXX中选择ZZZZ和BBBB,其他不选择 输入 输出根据分组数据中的特定条件筛选行-python,python,pandas,Python,Pandas,我有一个数据,其中的数据被分组在一起,但在我的最终输出中,我只需要输出满足条件的分组数据,即在分组数据中同时包含F和p值。仅包含F或P的分组将被丢弃。下表仅选择包含F和P的b_名称。从表XXXX中选择ZZZZ和BBBB,其他不选择 输入 输出 您可以按列b_name分组,然后使用仅保留那些同时在p_F列中具有F和p值的组(对于每个组)。接下来,使用drop_duplicates(“b_name”)删除重复的行,并将p_f设置为所需的输出 将熊猫作为pd导入 df=pd.read_csv(“sa
您可以按列
b_name
分组,然后使用仅保留那些同时在p_F
列中具有F
和p
值的组(对于每个组)。接下来,使用drop_duplicates(“b_name”)
删除重复的行,并将p_f
设置为所需的输出
将熊猫作为pd导入
df=pd.read_csv(“sample.csv”,sep=“;”)
打印(df)
df_group=df.groupby(“b_名称”)
df_过滤器=df_组过滤器(λx:
(x.p_F.值中的“F”)和(x.p_F.值中的“p”)
)
df_filter=df_filter.删除重复项(“b_名称”)
df_过滤器[“p_f”]=“FP”
打印(df_过滤器[[“b_id”、“b_名称”、“p_f”]])
来自df_滤波器的输出
b_id b_name p_f
0 29743 XXXX FP
3 29751 ZZZZ FP
6 30832 BBBB FP