Python 如何为变量的值指定标签
我有一个基本数据集,其中一个变量表示加利福尼亚州的一个县。这是一个连续变量,1是按字母顺序排列的第一个县,58是按字母顺序排列的最后一个县 例如:Python 如何为变量的值指定标签,python,stata,categorical-data,Python,Stata,Categorical Data,我有一个基本数据集,其中一个变量表示加利福尼亚州的一个县。这是一个连续变量,1是按字母顺序排列的第一个县,58是按字母顺序排列的最后一个县 例如: ID County 1 1 2 58 3 5 4 43 5 2 6 19 7 42 8 2 9 1 10 14 在斯塔塔,我会做以下工作:
ID County
1 1
2 58
3 5
4 43
5 2
6 19
7 42
8 2
9 1
10 14
在斯塔塔,我会做以下工作:
label define county_label 1 "Alameda" 2 "Alpine" 3 "Amador" 58 "Yuba"
label val county county_label
接下来,使用tablate命令,我得到以下输出:
ID County
1 Alameda
2 Yuba
3 Calaveras
4 Santa Clara
5 Alpine
6 Los Angeles
7 Santa Barbara
8 Alpine
9 Alameda
10 Inyo
在Python中,我尝试创建字典作为第一步:
county_dictionary={1:'Alameda',2:'Alpine',…58:'Yuba'}
然而,在这之后,我完全迷失了方向;我甚至不确定这是否必要
如何在Python中获得相同的输出?试试以下方法:
df['County'] = df.apply(lambda x: county_dictionary.get(x['County'], 'Unknown'), axis=1)
我使用了代码的一个变体:df['new_country_variable']=df.applylambda x:country_dictionary.getx['country'],axis=1