Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/visual-studio-2012/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python sns.pairplot返回Kmeans群集可视化的错误结果_Python_Seaborn_Cluster Analysis_K Means - Fatal编程技术网

Python sns.pairplot返回Kmeans群集可视化的错误结果

Python sns.pairplot返回Kmeans群集可视化的错误结果,python,seaborn,cluster-analysis,k-means,Python,Seaborn,Cluster Analysis,K Means,我试图使用sns.pairplot运行一个简单的散点图,我的最终目标是在我的数据上应用Kmeans集群。但我想把我的数据可视化。在应用任何东西之前,我想使用散点图。使用上面的代码,我得到的结果如下。数据由13列和大约450行组成。我不熟悉这些数据操作算法和可视化,我不确定我是否以正确的方式处理了这个问题。有什么更好的方法可以可视化我的数据?目标列是区域。我会留下一个到数据集的链接,可以在森林大火的Kaggle上找到。感谢您的帮助您的一些专栏是分类的,尽管您对它们进行了onehot编码,但使用散点

我试图使用sns.pairplot运行一个简单的散点图,我的最终目标是在我的数据上应用Kmeans集群。但我想把我的数据可视化。在应用任何东西之前,我想使用散点图。使用上面的代码,我得到的结果如下。数据由13列和大约450行组成。我不熟悉这些数据操作算法和可视化,我不确定我是否以正确的方式处理了这个问题。有什么更好的方法可以可视化我的数据?目标列是区域。我会留下一个到数据集的链接,可以在森林大火的Kaggle上找到。感谢您的帮助

您的一些专栏是分类的,尽管您对它们进行了onehot编码,但使用散点图绘制它们没有多大意义:

#import libraries
import pandas as pd
import numpy as np
import random as rd
import matplotlib.pyplot as plt
import seaborn as sns

data = pd.read_csv('C:/Users/yehya/Desktop/cmps276/forestfires.csv')
data = pd.get_dummies(data)

#Visualise data points

sns.pairplot(data)
sns.plt.show()
#plt.show()
如果先绘制数字列,则可以:

import pandas as pd
import numpy as np
import seaborn as sns

data = pd.read_csv('./forestfires.csv')
data.dtypes

X          int64
Y          int64
month     object
day       object
FFMC     float64
DMC      float64
DC       float64
ISI      float64
temp     float64
RH         int64
wind     float64
rain     float64
area     float64
dtype: object

可以使用中所示的图可视化分类值

num_cols = data.select_dtypes('number').columns.to_list()

num_cols
['X', 'Y', 'FFMC', 'DMC', 'DC', 'ISI', 'temp', 'RH', 'wind', 'rain', 'area']

sns.pairplot(data[num_cols])