R mgcv包中是否有忽略异常值的选项?

R mgcv包中是否有忽略异常值的选项?,r,spline,outliers,mgcv,R,Spline,Outliers,Mgcv,我正在用#mgcv#包做p样条曲线。安装后,大多数安装的项目看起来不错,但其中一些真的很糟糕。可以看出,异常值对曲线的影响很大。那么#mgcv#包中是否有处理这些异常值的选项? 库(mgcv) mgcv.ps您是否向我们提供了再现性数据?此外,为什么不在拟合GAM之前对数据进行预处理呢?如果数据的边界为0,那么将其建模为条件分布的高斯分布可能没有意义。如果您告诉我们更多关于数据的信息,也许我们可以提供具体的帮助。@GavinSimpson数据示例包含9800多个项目。大多数数据都是好的,这些拟

我正在用#mgcv#包做p样条曲线。安装后,大多数安装的项目看起来不错,但其中一些真的很糟糕。可以看出,异常值对曲线的影响很大。那么#mgcv#包中是否有处理这些异常值的选项?

库(mgcv)

mgcv.ps您是否向我们提供了再现性数据?此外,为什么不在拟合GAM之前对数据进行预处理呢?如果数据的边界为0,那么将其建模为条件分布的高斯分布可能没有意义。如果您告诉我们更多关于数据的信息,也许我们可以提供具体的帮助。@GavinSimpson数据示例包含9800多个项目。大多数数据都是好的,这些拟合不良的模型是由NRMSE(rmse/平均值或rmse/标准差)发现的。假设一个项目有55分,总共有9800个不同的项目。这是一个一维数据样本。我上传了数据的快速查看。@VitaliAvagyan,因为不同项目之间的差异非常大。我认为它不能简单地定义为预处理异常值的标准。@Zywo0这不是重点;如果数据的边界为零,则拟合的模型是错误的。如果您适合正确的模型,这些点可能不是异常值或具有如此强大的影响(尽管我怀疑它们仍然具有影响)。如果数据限定为0(不能有负数),则需要i)解释响应是什么,ii)选择更合适的模型/分布并重新安装,然后评估不匹配。
  library(mgcv)
  mgcv.ps <- gam(y~s(x, bs='ps'), method = "GCV.Cp")
  t.g <- predict(mgcv.ps)