Python 分类掩蔽
我有一个我认为很简单的问题,但我在文档中找不到我想要的东西 我有一个数据框,它有一个Python 分类掩蔽,python,pandas,numpy,dataframe,Python,Pandas,Numpy,Dataframe,我有一个我认为很简单的问题,但我在文档中找不到我想要的东西 我有一个数据框,它有一个category列,名为mycol,有一个a和b类别,我想按如下方式屏蔽数据框的一个子集: df_a=df[df.mycol.equal('a')] 目前我正在做: df_a = df[df.mycol.cat.codes.values==df.mycol.cat.categories.to_list().index('a')] 这显然是非常冗长和不雅的。由于df.mycol既有代码又有编码标签,它拥有执行此操
category
列,名为mycol
,有一个a
和b
类别,我想按如下方式屏蔽数据框的一个子集:
df_a=df[df.mycol.equal('a')]
目前我正在做:
df_a = df[df.mycol.cat.codes.values==df.mycol.cat.categories.to_list().index('a')]
这显然是非常冗长和不雅的。由于df.mycol
既有代码又有编码标签,它拥有执行此操作的所有信息,因此我想知道执行此操作的最佳方法
df_a = df[df["mycol"]=='a']
我相信这应该是可行的,除非你说的“掩码”是指你想实际将没有a的值归零(
df_a=df[df.mycol='a']
不起作用?我不明白你当前的方法应该解决什么问题我用df=pd.DataFrame({'mycol':pd.category(list('aaabbababa'))测试它)
和df_a=df[df.mycol=='a']
工作正常。