Python sns.pairplot返回Kmeans群集可视化的错误结果
我试图使用sns.pairplot运行一个简单的散点图,我的最终目标是在我的数据上应用Kmeans集群。但我想把我的数据可视化。在应用任何东西之前,我想使用散点图。使用上面的代码,我得到的结果如下。数据由13列和大约450行组成。我不熟悉这些数据操作算法和可视化,我不确定我是否以正确的方式处理了这个问题。有什么更好的方法可以可视化我的数据?目标列是区域。我会留下一个到数据集的链接,可以在森林大火的Kaggle上找到。感谢您的帮助您的一些专栏是分类的,尽管您对它们进行了onehot编码,但使用散点图绘制它们没有多大意义:Python sns.pairplot返回Kmeans群集可视化的错误结果,python,seaborn,cluster-analysis,k-means,Python,Seaborn,Cluster Analysis,K Means,我试图使用sns.pairplot运行一个简单的散点图,我的最终目标是在我的数据上应用Kmeans集群。但我想把我的数据可视化。在应用任何东西之前,我想使用散点图。使用上面的代码,我得到的结果如下。数据由13列和大约450行组成。我不熟悉这些数据操作算法和可视化,我不确定我是否以正确的方式处理了这个问题。有什么更好的方法可以可视化我的数据?目标列是区域。我会留下一个到数据集的链接,可以在森林大火的Kaggle上找到。感谢您的帮助您的一些专栏是分类的,尽管您对它们进行了onehot编码,但使用散点
#import libraries
import pandas as pd
import numpy as np
import random as rd
import matplotlib.pyplot as plt
import seaborn as sns
data = pd.read_csv('C:/Users/yehya/Desktop/cmps276/forestfires.csv')
data = pd.get_dummies(data)
#Visualise data points
sns.pairplot(data)
sns.plt.show()
#plt.show()
如果先绘制数字列,则可以:
import pandas as pd
import numpy as np
import seaborn as sns
data = pd.read_csv('./forestfires.csv')
data.dtypes
X int64
Y int64
month object
day object
FFMC float64
DMC float64
DC float64
ISI float64
temp float64
RH int64
wind float64
rain float64
area float64
dtype: object
可以使用中所示的图可视化分类值
num_cols = data.select_dtypes('number').columns.to_list()
num_cols
['X', 'Y', 'FFMC', 'DMC', 'DC', 'ISI', 'temp', 'RH', 'wind', 'rain', 'area']
sns.pairplot(data[num_cols])