Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/290.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/webpack/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python Seaborn pairplot:数据必须具有方差才能计算内核密度估计_Python_Seaborn_Kernel Density - Fatal编程技术网

Python Seaborn pairplot:数据必须具有方差才能计算内核密度估计

Python Seaborn pairplot:数据必须具有方差才能计算内核密度估计,python,seaborn,kernel-density,Python,Seaborn,Kernel Density,我正在尝试运行以下代码: print();打印(“散点矩阵图”) sns.pairplot(数据集,色调='Protein',diag_kind=“kde”) plt.show() 其中,数据集是使用dataset=pd.read_csv(文件名,sep=',',names=col_names)从csv读取的数据。 当我运行这段代码时,我没有得到终止错误,而是得到了一个警告,即“数据必须有方差才能计算内核密度估计值”,并且没有一个图有kde曲线通过它们。我查了一下,发现这可能是由于重复数据造成

我正在尝试运行以下代码:

print();打印(“散点矩阵图”)
sns.pairplot(数据集,色调='Protein',diag_kind=“kde”)
plt.show()
其中,数据集是使用
dataset=pd.read_csv(文件名,sep=',',names=col_names)从csv读取的数据。


当我运行这段代码时,我没有得到终止错误,而是得到了一个警告,即“
数据必须有方差才能计算内核密度估计值”
,并且没有一个图有kde曲线通过它们。我查了一下,发现这可能是由于重复数据造成的,但记录解决方案的唯一实例是使用
kdeplot()
函数的实例,因此我不知所措。

不知道
蛋白质
是什么类型的数据,我从它的名称猜它是分类的。在这种情况下,
Protein
中可能有一个值只出现一次,因此无法计算相应数据的方差

查找
蛋白质
-任何列中只有一个唯一值的值:

only_one_by_prot = (dataset
                    .groupby("Protein")
                    .nunique() = 1
                   ).any(axis=1)
要获取这些
蛋白质
值的列表,请执行以下操作:

proteins_with_too_little_data = (
    only_one_by_prot[only_one_by_prot]
    .index.values
)
要从
数据集
中筛选出这些
蛋白质
-值:

dataset.query("Protein not in @proteins_with_too_little_data")

我不认为你的
蛋白质
列有连续的数值,但这在西伯恩斯
色调
中通常不起作用,因为很可能某些数字只出现一次。在这种情况下,在不知道蛋白质是什么类型的数据的情况下,我从它的名称猜测它是分类的。在这种情况下,
Protein
中可能有一个值只出现一次,因此无法计算相应数据的方差

查找
蛋白质
-任何列中只有一个唯一值的值:

only_one_by_prot = (dataset
                    .groupby("Protein")
                    .nunique() = 1
                   ).any(axis=1)
要获取这些
蛋白质
值的列表,请执行以下操作:

proteins_with_too_little_data = (
    only_one_by_prot[only_one_by_prot]
    .index.values
)
要从
数据集
中筛选出这些
蛋白质
-值:

dataset.query("Protein not in @proteins_with_too_little_data")
我不认为你的
蛋白质
列有连续的数值,但这在西伯恩斯
色调
中通常不起作用,因为很可能某些数字只出现一次。在这种情况下,存储数据,例如使用