Python 熊猫中的应用与替换?
我正在自学Pandas和Python,并试图找出如何用字符串替换充满整数的列。假设我有一个满是年龄的数据集,我想在一个新的列中将它们分类。 年龄<30岁,替换为字符串“young” 年龄在30到50岁之间,替换为“中年” 年龄>50岁,替换为“较老” 最简单的方法是什么 我已经用数据帧研究了.apply和.replace-do,但我感到困惑。我应该学习什么是“lambda”吗?我应该先定义一个函数,然后使用.apply函数,还是有更简单的方法?非常感谢Python 熊猫中的应用与替换?,python,pandas,Python,Pandas,我正在自学Pandas和Python,并试图找出如何用字符串替换充满整数的列。假设我有一个满是年龄的数据集,我想在一个新的列中将它们分类。 年龄50岁,替换为“较老” 最简单的方法是什么 我已经用数据帧研究了.apply和.replace-do,但我感到困惑。我应该学习什么是“lambda”吗?我应该先定义一个函数,然后使用.apply函数,还是有更简单的方法?非常感谢 1 62 2 47 3 34 您可以创建一个函数来确定年龄: def check(age): if age >
1 62
2 47
3 34
您可以创建一个函数来确定年龄:
def check(age):
if age > 50:
return 'Old'
elif 30 <= age <= 50:
return 'Middle'
else:
return 'Young'
结果:
0 62
1 47
2 34
0 Old
1 Middle
2 Middle
您可以创建一个函数来确定年龄:
def check(age):
if age > 50:
return 'Old'
elif 30 <= age <= 50:
return 'Middle'
else:
return 'Young'
结果:
0 62
1 47
2 34
0 Old
1 Middle
2 Middle
也可以直接改变df
df.loc[(df['age']<30),'age']='young'
df.loc[(df['age']>=30) & (df['age']<=50),'age']='middle'
df.loc[(df['age']>50),'age']='old'
df.loc[(df['age']=30)和(df['age']50),'age']=old'
也可以直接更改df
df.loc[(df['age']<30),'age']='young'
df.loc[(df['age']>=30) & (df['age']<=50),'age']='middle'
df.loc[(df['age']>50),'age']='old'
df.loc[(df['age']=30)和(df['age']50),'age']=old'
您只处理了apply()和未能解决的问题。replace()您只处理了apply()和未能解决的问题。replace()