Python 如何计算两列之间的距离并绘制它们

Python 如何计算两列之间的距离并绘制它们,python,pandas,Python,Pandas,我正在做一个情绪分析项目,因此我试图从不同的角度看我的模型表现 下面是一个示例表: |Topic|value|label| |A |-0.99|0 | |B |-0.98|1 | |c |-0.93|0 | |d |0.8 |1 | |e |0.91 |1 | |f |0.97 |0 | 我的目标是计算column:value和label之间点的欧几里德距离,并将它们放在dataframe中的一列中 这里,如果值列中的数

我正在做一个情绪分析项目,因此我试图从不同的角度看我的模型表现

下面是一个示例表:

|Topic|value|label|
|A    |-0.99|0    |
|B    |-0.98|1    |
|c    |-0.93|0    |
|d    |0.8  |1    |
|e    |0.91 |1    |
|f    |0.97 |0    |
我的目标是计算column:value和label之间点的欧几里德距离,并将它们放在dataframe中的一列中

这里,如果值列中的数据朝向+ve且标签为1,则其为理想值,如果值朝向-ve且标签为0,则其为理想值。反之亦然是不可取的

我想研究偏差,所以我想绘制距离和值列

作为ML和python的新手,我遇到了一些internet结果,如:

来自numpy.linalg导入规范
df['distance']=norm(df['value']-df['label'])

df.plot(x='component',y='distance')
您发现的是用于计算两个向量之间的欧几里德距离,因此您得到一个值,因为它将
视为一个数据点,将
标签
视为一个数据点,并给出这两个点之间的欧几里德距离

由于您只有一个坐标,因此需要的是绝对距离:

df = pd.DataFrame({'Topic':['A','B','c','d','e','f'],'value':[-0.99,-0.98,-0.93,0.8,0.91,0.97],
                   'label':[0,1,0,1,1,0]})

df['distance'] = abs(df['value']-df['label'])

df.plot.scatter(x='value', y='distance')

很高兴它成功了!我在同一行上贴了另一个问题——如果你也能看到,我将非常感激。对于像这样的门户网站,我无法用语言表达我的感激之情,因为像我这样的初学者可以从你们这样的专家那里学习