Warning: file_get_contents(/data/phpspider/zhask/data//catemap/6/cplusplus/139.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 从dataframe中的现有数据生成新变量_Python_Dataframe_Pandas - Fatal编程技术网

Python 从dataframe中的现有数据生成新变量

Python 从dataframe中的现有数据生成新变量,python,dataframe,pandas,Python,Dataframe,Pandas,我需要一些在数据帧中形成新变量的帮助 我有一个非常大的数据集,我想从另一列的现有数据中创建一个新变量。 这里有一个例子 >>> df A B 0 a 1 1 b 2 2 c 3 3 a 5 4 d 6 我想创建一个新列,其中a和c的值命名为ac,b和d的值命名为bd 最终结果应该是这样的。从中对它们进行分组,并在新列中为组指定一个新名称 >>> df A B C 0 a 1 ac 1

我需要一些在数据帧中形成新变量的帮助 我有一个非常大的数据集,我想从另一列的现有数据中创建一个新变量。 这里有一个例子

>>> df
   A  B   
0  a  1  
1  b  2  
2  c  3  
3  a  5  
4  d  6  
我想创建一个新列,其中a和c的值命名为ac,b和d的值命名为bd 最终结果应该是这样的。从中对它们进行分组,并在新列中为组指定一个新名称

>>> df
   A  B   C
0  a  1  ac
1  b  2  bd
2  c  3  ac
3  a  5  ac
4  d  6  bd

/Jonas

C中的映射是如何确定的?a或C应该导致C列中的ac…即a和C应该设置为属于一个名为ac的组。谢谢Jeff!这就是我要找的!!
In [4]: mapper = dict(a = 'ac', b = 'bd', c = 'ac', d = 'bd')

In [5]: df['C'] = [ mapper[x] for x in df['A'] ]

In [6]: df
Out[6]: 
   A  B   C
0  a  1  ac
1  b  2  bd
2  c  3  ac
3  a  5  ac
4  d  6  bd