Python 如何为变量的值指定标签_Python_Stata_Categorical Data

Python 如何为变量的值指定标签

python stata

Python 如何为变量的值指定标签,python,stata,categorical-data,Python,Stata,Categorical Data,我有一个基本数据集，其中一个变量表示加利福尼亚州的一个县。这是一个连续变量，1是按字母顺序排列的第一个县，58是按字母顺序排列的最后一个县例如： ID County 1 1 2 58 3 5 4 43 5 2 6 19 7 42 8 2 9 1 10 14 在斯塔塔，我会做以下工作：

我有一个基本数据集，其中一个变量表示加利福尼亚州的一个县。这是一个连续变量，1是按字母顺序排列的第一个县，58是按字母顺序排列的最后一个县

例如：

ID      County  
1         1  
2         58  
3         5  
4         43  
5         2  
6         19  
7         42  
8         2  
9         1  
10        14

在斯塔塔，我会做以下工作：

label define county_label 1 "Alameda" 2 "Alpine" 3 "Amador" 58 "Yuba"  
label val county county_label

接下来，使用tablate命令，我得到以下输出：

ID      County  
1         Alameda  
2         Yuba  
3         Calaveras  
4         Santa Clara  
5         Alpine  
6         Los Angeles  
7         Santa Barbara  
8         Alpine  
9         Alameda  
10        Inyo

在Python中，我尝试创建字典作为第一步：

county_dictionary={1:'Alameda'，2:'Alpine'，…58:'Yuba'} 然而，在这之后，我完全迷失了方向；我甚至不确定这是否必要

如何在Python中获得相同的输出？

试试以下方法：

df['County'] = df.apply(lambda x: county_dictionary.get(x['County'], 'Unknown'), axis=1)

我使用了代码的一个变体：df['new_country_variable']=df.applylambda x:country_dictionary.getx['country']，axis=1