Matplotlib 大数据集的置信区间

Matplotlib 大数据集的置信区间,matplotlib,statistics,regression,seaborn,confidence-interval,Matplotlib,Statistics,Regression,Seaborn,Confidence Interval,我想得到非常大的数据集的置信区间。它由大约700000个x和y点组成。我还尝试使用较少的数据,比如200个点,这样就可以进行绘图。但是,当涉及到我的特定数据集时,它没有显示置信区间 为此,我的代码基于: x_x=np.array(y_test[:,0])约700000点 y_y=np.array(y_pred[:,0])#约700000点 sns.set(样式='whitegrid') p=sns.FaceGrid(d,尺寸=4,纵横比=1.5) p、 地图(plt.scatter,'x_x',

我想得到非常大的数据集的置信区间。它由大约700000个x和y点组成。我还尝试使用较少的数据,比如200个点,这样就可以进行绘图。但是,当涉及到我的特定数据集时,它没有显示置信区间

为此,我的代码基于:

x_x=np.array(y_test[:,0])约700000点
y_y=np.array(y_pred[:,0])#约700000点
sns.set(样式='whitegrid')
p=sns.FaceGrid(d,尺寸=4,纵横比=1.5)
p、 地图(plt.scatter,'x_x','y_y',颜色='red')
p、 地图(sns.regplot,'x_x','y_y',散布=False,ci=95,
fit_reg=True,颜色=‘蓝色’)
p、 map(sns.regplot,'x_x','y_y',scatter=False,ci=0,
fit_reg=True,color='darkgreen')
以及迄今为止的数字:

置信区间随着数据点的数量而缩小。由于有700K个点,它们可能很小,以至于在绘图上看不见。(但是,如果您没有700K的独立观测值,这将低估实际的不确定性)。感谢您的回答,在这种情况下,是否有合适的统计分析要应用?您想用CI显示什么?只要你使用线性回归,你的预测误差与样本数成反比,