Python 是否有一种使用get_dummies()动态预处理(拆分)元素的方法?
我已经为这个问题挣扎了一段时间,但我无法理解 我有一些我正试图准备的数据,在此过程中,我必须使用虚拟机将数据的某些分类部分转换为二进制文件(我想) 问题是,我的原始数据中的一些条目实际上可以“属于”所讨论的特定维度的一个或多个类别,我希望这在下面的示例中是清楚的。我希望能够将一个条目归因于多个类别,或者为假人(或者其他类似的东西)做一些工作,从而实现这一点 我所拥有的是这样的:Python 是否有一种使用get_dummies()动态预处理(拆分)元素的方法?,python,python-3.x,pandas,Python,Python 3.x,Pandas,我已经为这个问题挣扎了一段时间,但我无法理解 我有一些我正试图准备的数据,在此过程中,我必须使用虚拟机将数据的某些分类部分转换为二进制文件(我想) 问题是,我的原始数据中的一些条目实际上可以“属于”所讨论的特定维度的一个或多个类别,我希望这在下面的示例中是清楚的。我希望能够将一个条目归因于多个类别,或者为假人(或者其他类似的东西)做一些工作,从而实现这一点 我所拥有的是这样的: In [116]: df_sample Out[116]: A B C
In [116]: df_sample
Out[116]:
A B C
0 A1 12.000000 CAT1
1 A2 0.029767 CAT2
2 A3 -2.321058 CAT3
3 A4 121.000000 CAT1,CAT2
4 A5 0.493182 CAT3
通过使用pd.get_dummies()
但事实上,我想找到一种方法来实现这一点:
>>> pd.get_dummies(df_sample.C)
CAT1 CAT2 CAT3
0 1.0 0.0 0.0
1 0.0 1.0 0.0
2 0.0 0.0 1.0
3 1.0 1.0 0.0
4 0.0 0.0 1.0
第三行同时打开CAT1
和CAT2
感谢您的帮助 在
get_dummies()
是的,这肯定会做得很好。我正在查看
pd.get\u dummies()
函数,其中没有sep
选项,这与系列.get\u dummies()
不同。谢谢
>>> pd.get_dummies(df_sample.C)
CAT1 CAT2 CAT3
0 1.0 0.0 0.0
1 0.0 1.0 0.0
2 0.0 0.0 1.0
3 1.0 1.0 0.0
4 0.0 0.0 1.0
In [379]: df_sample['C'].str.get_dummies(sep=',')
Out[379]:
CAT1 CAT2 CAT3
0 1 0 0
1 0 1 0
2 0 0 1
3 1 1 0
4 0 0 1