PythonValueError:只能比较标记相同的系列对象
我正在比较的两个数据帧的大小不同(虽然索引相同),我想这就是我得到错误的原因。你能给我建议一个解决这个问题的方法吗。我正在寻找df2中用户id与df1匹配的行。感谢并感谢您的回复PythonValueError:只能比较标记相同的系列对象,python,pandas,Python,Pandas,我正在比较的两个数据帧的大小不同(虽然索引相同),我想这就是我得到错误的原因。你能给我建议一个解决这个问题的方法吗。我正在寻找df2中用户id与df1匹配的行。感谢并感谢您的回复 data = np.array([['user_id','comment','label'], [100,'RT @Dvillain_: #oomf should text me.',0], [100,'Buy viagra',1], [101,
data = np.array([['user_id','comment','label'],
[100,'RT @Dvillain_: #oomf should text me.',0],
[100,'Buy viagra',1],
[101,'#nowplaying M.C. Shan - Juice Crew Law on',0],
[101,'Buy viagra two',1]])
data2 = np.array([['user_id','comment','label'],
[100,'First comment',0],
[100,'Buy viagra',1],
[102,'Buy viagra two',1]])
df1 = pd.DataFrame(data=data[1:,0:],columns = data[0,0:])
df2 = pd.DataFrame(data=data2[1:,0:],columns = data[0,0:])
df = df2[df2['user_id'] == df1['user_id']]
您正在寻找
isin
df = df2[df2['user_id'].isin(df1['user_id'])]
df
Out[814]:
user_id comment label
0 100 First comment 0
1 100 Buy viagra 1
快来吧@保罗,快一点。我很幸运:-)@Chandan yw~编码快乐