Python 从dataframe中的现有数据生成新变量
我需要一些在数据帧中形成新变量的帮助 我有一个非常大的数据集,我想从另一列的现有数据中创建一个新变量。 这里有一个例子Python 从dataframe中的现有数据生成新变量,python,dataframe,pandas,Python,Dataframe,Pandas,我需要一些在数据帧中形成新变量的帮助 我有一个非常大的数据集,我想从另一列的现有数据中创建一个新变量。 这里有一个例子 >>> df A B 0 a 1 1 b 2 2 c 3 3 a 5 4 d 6 我想创建一个新列,其中a和c的值命名为ac,b和d的值命名为bd 最终结果应该是这样的。从中对它们进行分组,并在新列中为组指定一个新名称 >>> df A B C 0 a 1 ac 1
>>> df
A B
0 a 1
1 b 2
2 c 3
3 a 5
4 d 6
我想创建一个新列,其中a和c的值命名为ac,b和d的值命名为bd
最终结果应该是这样的。从中对它们进行分组,并在新列中为组指定一个新名称
>>> df
A B C
0 a 1 ac
1 b 2 bd
2 c 3 ac
3 a 5 ac
4 d 6 bd
/JonasC中的映射是如何确定的?a或C应该导致C列中的ac…即a和C应该设置为属于一个名为ac的组。谢谢Jeff!这就是我要找的!!
In [4]: mapper = dict(a = 'ac', b = 'bd', c = 'ac', d = 'bd')
In [5]: df['C'] = [ mapper[x] for x in df['A'] ]
In [6]: df
Out[6]:
A B C
0 a 1 ac
1 b 2 bd
2 c 3 ac
3 a 5 ac
4 d 6 bd