在python中可视化两列之间的关联

在python中可视化两列之间的关联,python,python-3.x,matplotlib,machine-learning,statistics,Python,Python 3.x,Matplotlib,Machine Learning,Statistics,我有两个专栏。第一列包含与工资相关的数据,第二列包含与员工住房租金相关的数据。现在使用python,我想找到两者之间的相关性。Python中是否有某种方法可以可视化相关性: Salary house_rent 10000 50 10000 50 3000 465 本任务的重点是找出员工的工资和房租之间的相关性。例如,一些员工的工资可能很高,但房租很低,而另一些员工的工资可能很低,但房租很高。请注意,两个人的工资和房租是一样的。可以在python中可视化吗?您可以使用sk

我有两个专栏。第一列包含与工资相关的数据,第二列包含与员工住房租金相关的数据。现在使用python,我想找到两者之间的相关性。Python中是否有某种方法可以可视化相关性:

Salary   house_rent
10000    50
10000    50
3000     465

本任务的重点是找出员工的工资和房租之间的相关性。例如,一些员工的工资可能很高,但房租很低,而另一些员工的工资可能很低,但房租很高。请注意,两个人的工资和房租是一样的。可以在python中可视化吗?

您可以使用sklearn.linear\u model.LinearRegression绘制一条线性回归线:

还可以使用matplotlib中的pyplot.matshow()构建相关矩阵:

import matplotlib.pyplot as plt

plt.matshow(dataframe.corr())
plt.show()

如前所述,您可以使用
corr
中的方法获得相关性。 更好的可视化方法是使用
seaborn
库,而不是
matplotlib

import seaborn as sns
import pandas as pd
import matplotlib.pyplot as plt
sns.set(style="ticks", color_codes=True)    
df= pd.read_csv('path_to_your_csv_file')
g = sns.pairplot(df)
plt.show()
有关更多详细信息,请参阅 及

这里的dataframe是什么?dataframe将是上述数据集的一个实例。只需将数据集存储为csv文件(如使用excel)并使用pandas库导入即可。导入熊猫作为pd dataframe=pd.read\u csv(“文件名”),您需要调用
plt.show()
。我已经更新了答案。它显示了4个图,每个图的意思是什么?它将所有的列相互配对。请参考答案中给出的链接,或者在互联网上搜索pairplot解释。