Python 比较DataFrame中的两列并填充第三列
我有一个DF,里面有两个int列,'CNT'和'STG_TABLE_CNT'。我想添加一个新列“IS_MATCH”,如果“CNT”和“STG_TABLE_CNT”具有相同的值,则返回“Y”,如果不具有相同的值,则返回“N” 我试过这个:Python 比较DataFrame中的两列并填充第三列,python,pandas,Python,Pandas,我有一个DF,里面有两个int列,'CNT'和'STG_TABLE_CNT'。我想添加一个新列“IS_MATCH”,如果“CNT”和“STG_TABLE_CNT”具有相同的值,则返回“Y”,如果不具有相同的值,则返回“N” 我试过这个: if result['CNT'] == result['STG_TABLE_CNT']: result['IS_MATCH'] = 'Y' else: result['IS_MATCH'] = 'N' 但这会引发以下错误: ValueError
if result['CNT'] == result['STG_TABLE_CNT']:
result['IS_MATCH'] = 'Y'
else:
result['IS_MATCH'] = 'N'
但这会引发以下错误:
ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().
我意识到它是在寻找相等(真/假)我只是不知道如何绕过它而返回“Y”或“N”
result['CNT']==result['STG\u TABLE\u CNT']
给你一个完整的序列,而pandas
则抱怨它不知道如何将该序列转换为True
或False
。你真正想要的是
result['IS_MATCH'] = (result['CNT'] == result['STG_TABLE_CNT']).\
apply(lambda x: 'Y' if x else 'N')
或
result['CNT']==result['STG_TABLE_CNT']
为您提供了一个完整的系列,而pandas
抱怨它不知道如何将该系列转换为True
或False
。你真正想要的是
result['IS_MATCH'] = (result['CNT'] == result['STG_TABLE_CNT']).\
apply(lambda x: 'Y' if x else 'N')
或
使用时,它比应用
或评级
更快:
import numpy as np
df['IS_MATCH'] = np.where(result['CNT'].eq(result['STG_TABLE_CNT']), 'Y', 'N')
使用时,它比应用
或评级
更快:
import numpy as np
df['IS_MATCH'] = np.where(result['CNT'].eq(result['STG_TABLE_CNT']), 'Y', 'N')
谢谢,你对错误发生原因的解释也很有用谢谢,你对错误发生原因的解释也很有用