Python Seaborn pairplot：数据必须具有方差才能计算内核密度估计_Python_Seaborn_Kernel Density

Python Seaborn pairplot：数据必须具有方差才能计算内核密度估计

python

Python Seaborn pairplot：数据必须具有方差才能计算内核密度估计,python,seaborn,kernel-density,Python,Seaborn,Kernel Density,我正在尝试运行以下代码： print（）；打印（“散点矩阵图”） sns.pairplot（数据集，色调='Protein'，diag_kind=“kde”） plt.show（）其中，数据集是使用dataset=pd.read_csv（文件名，sep='，'，names=col_names）从csv读取的数据。当我运行这段代码时，我没有得到终止错误，而是得到了一个警告，即“数据必须有方差才能计算内核密度估计值”，并且没有一个图有kde曲线通过它们。我查了一下，发现这可能是由于重复数据造成

我正在尝试运行以下代码：

print（）；打印（“散点矩阵图”）
sns.pairplot（数据集，色调='Protein'，diag_kind=“kde”）
plt.show（）

其中，数据集是使用

dataset=pd.read_csv（文件名，sep='，'，names=col_names）从csv读取的数据。

当我运行这段代码时，我没有得到终止错误，而是得到了一个警告，即“

数据必须有方差才能计算内核密度估计值”

，并且没有一个图有kde曲线通过它们。我查了一下，发现这可能是由于重复数据造成的，但记录解决方案的唯一实例是使用

kdeplot（）

函数的实例，因此我不知所措。

不知道

蛋白质

是什么类型的数据，我从它的名称猜它是分类的。在这种情况下，

Protein

中可能有一个值只出现一次，因此无法计算相应数据的方差

查找

蛋白质

-任何列中只有一个唯一值的值：

only_one_by_prot = (dataset
                    .groupby("Protein")
                    .nunique() = 1
                   ).any(axis=1)

要获取这些

蛋白质值的列表，请执行以下操作：
proteins_with_too_little_data = (
    only_one_by_prot[only_one_by_prot]
    .index.values
)

要从数据集
中筛选出这些蛋白质
-值：
dataset.query("Protein not in @proteins_with_too_little_data")

我不认为你的蛋白质
列有连续的数值，但这在西伯恩斯色调
中通常不起作用，因为很可能某些数字只出现一次。在这种情况下，在不知道蛋白质是什么类型的数据的情况下，我从它的名称猜测它是分类的。在这种情况下，Protein
中可能有一个值只出现一次，因此无法计算相应数据的方差
查找蛋白质
-任何列中只有一个唯一值的值：
only_one_by_prot = (dataset
                    .groupby("Protein")
                    .nunique() = 1
                   ).any(axis=1)

要获取这些蛋白质值的列表，请执行以下操作：
proteins_with_too_little_data = (
    only_one_by_prot[only_one_by_prot]
    .index.values
)

要从数据集
中筛选出这些蛋白质
-值：
dataset.query("Protein not in @proteins_with_too_little_data")

我不认为你的蛋白质
列有连续的数值，但这在西伯恩斯色调
中通常不起作用，因为很可能某些数字只出现一次。在这种情况下，存储数据，例如使用