Python 在数据帧中使用replace和str.startswith()重命名值
我有一个名为source的列,其中包含数百行文本。 问题是其中的一些可以组合在一起,我正在熊猫数据框架中努力做到这一点。这是我的密码:Python 在数据帧中使用replace和str.startswith()重命名值,python,string,pandas,series,Python,String,Pandas,Series,我有一个名为source的列,其中包含数百行文本。 问题是其中的一些可以组合在一起,我正在熊猫数据框架中努力做到这一点。这是我的密码: df.source.replace({ df.source.str.startswith('share', na=False): 'sharePet', df.source.str.startswith('2012-01-08', na=False): 'shareDate'
df.source.replace({
df.source.str.startswith('share', na=False): 'sharePet',
df.source.str.startswith('2012-01-08', na=False): 'shareDate'
})
另外,第二行以日期开头,这行行行吗?如果没有,我可以把它放在第一行和其他文本分组中
我想听听你的建议 您可以使用字典并迭代:
d = {'share': 'sharePet', '2012-01-08': 'shareDate'}
for k, v in d.items():
df.loc[df['source'].str.startswith(k, na=False), 'source'] = v
熊猫str.startswith
仅适用于字符串。您可以通过set(map(type,df['source'))
轻松检查序列中存在哪些类型