Python Seaborn pairplot:数据必须具有方差才能计算内核密度估计
我正在尝试运行以下代码:Python Seaborn pairplot:数据必须具有方差才能计算内核密度估计,python,seaborn,kernel-density,Python,Seaborn,Kernel Density,我正在尝试运行以下代码: print();打印(“散点矩阵图”) sns.pairplot(数据集,色调='Protein',diag_kind=“kde”) plt.show() 其中,数据集是使用dataset=pd.read_csv(文件名,sep=',',names=col_names)从csv读取的数据。 当我运行这段代码时,我没有得到终止错误,而是得到了一个警告,即“数据必须有方差才能计算内核密度估计值”,并且没有一个图有kde曲线通过它们。我查了一下,发现这可能是由于重复数据造成
print();打印(“散点矩阵图”)
sns.pairplot(数据集,色调='Protein',diag_kind=“kde”)
plt.show()
其中,数据集是使用dataset=pd.read_csv(文件名,sep=',',names=col_names)从csv读取的数据。
当我运行这段代码时,我没有得到终止错误,而是得到了一个警告,即“
数据必须有方差才能计算内核密度估计值”
,并且没有一个图有kde曲线通过它们。我查了一下,发现这可能是由于重复数据造成的,但记录解决方案的唯一实例是使用kdeplot()
函数的实例,因此我不知所措。不知道蛋白质
是什么类型的数据,我从它的名称猜它是分类的。在这种情况下,Protein
中可能有一个值只出现一次,因此无法计算相应数据的方差
查找蛋白质
-任何列中只有一个唯一值的值:
only_one_by_prot = (dataset
.groupby("Protein")
.nunique() = 1
).any(axis=1)
要获取这些蛋白质值的列表,请执行以下操作:
proteins_with_too_little_data = (
only_one_by_prot[only_one_by_prot]
.index.values
)
要从数据集
中筛选出这些蛋白质
-值:
dataset.query("Protein not in @proteins_with_too_little_data")
我不认为你的蛋白质
列有连续的数值,但这在西伯恩斯色调
中通常不起作用,因为很可能某些数字只出现一次。在这种情况下,在不知道蛋白质是什么类型的数据的情况下,我从它的名称猜测它是分类的。在这种情况下,Protein
中可能有一个值只出现一次,因此无法计算相应数据的方差
查找蛋白质
-任何列中只有一个唯一值的值:
only_one_by_prot = (dataset
.groupby("Protein")
.nunique() = 1
).any(axis=1)
要获取这些蛋白质值的列表,请执行以下操作:
proteins_with_too_little_data = (
only_one_by_prot[only_one_by_prot]
.index.values
)
要从数据集
中筛选出这些蛋白质
-值:
dataset.query("Protein not in @proteins_with_too_little_data")
我不认为你的蛋白质
列有连续的数值,但这在西伯恩斯色调
中通常不起作用,因为很可能某些数字只出现一次。在这种情况下,存储数据,例如使用