Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/dart/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R 删除扭曲数据的异常值_R_Ggplot2_Dplyr_Normalization_Denormalization - Fatal编程技术网

R 删除扭曲数据的异常值

R 删除扭曲数据的异常值,r,ggplot2,dplyr,normalization,denormalization,R,Ggplot2,Dplyr,Normalization,Denormalization,我正在研究农业强度和鸟类功能多样性之间的关系 在我的GLM模型中,我包含了许多其他变量,包括森林、半自然栖息地、温度、杀虫剂等 当查看我的变量是否为正态分布时,我使用QQplot来识别正态性,似乎存在这3个异常值 我想知道如何去除这些异常值,使我的数据更为正态分布 我试图使用outliers软件包,但我发现的所有示例都失败了,或者我无法理解它们是如何工作的 任何帮助都将不胜感激。这是我的QQ图,用于我的功能分散模型和功能分散x农业强度的分散。 QQ图 功能分散x农业分散 您可以删除显示不正确的

我正在研究农业强度和鸟类功能多样性之间的关系

在我的GLM模型中,我包含了许多其他变量,包括森林、半自然栖息地、温度、杀虫剂等

当查看我的变量是否为正态分布时,我使用QQplot来识别正态性,似乎存在这3个异常值

我想知道如何去除这些异常值,使我的数据更为正态分布

我试图使用outliers软件包,但我发现的所有示例都失败了,或者我无法理解它们是如何工作的

任何帮助都将不胜感激。这是我的QQ图,用于我的功能分散模型和功能分散x农业强度的分散。 QQ图

功能分散x农业分散


您可以删除显示不正确的观察结果。鉴于观察的数量,这不太可能改变估计,但请确保确实如此。此外,在报告您的工作时,请确保根据您对变量的领域知识证明删除这些点的原因

您可以使用删除观察

model.data.scaled <- model.data.scaled[model.data.scaled$agri > -5, ]
model.data.scaled-5,]

仅仅因为数据点不适合您的模型而删除数据点是一个坏主意,而且线性模型的数据没有正态性假设。GLM假设残差的正态分布,而不是模型中的变量。仅仅因为某些变量可能不符合您的模型,您如何科学地证明删除这些变量的合理性?如果你的模型错了怎么办?目前的模式是否“足够好”?为什么?嗨!谢谢你-它似乎没有移除它们,我做错什么了吗<代码>model.data.scaled.outlier-5、]func.disp.glm.outlier请确保至少删除了行970、710和938。请仅对文本使用注释,您提供的代码段(尤其是打印部分)未显示任何相关信息。我还看到您正在使用来自两个不同来源的数据。这可能并不理想。没有一个可复制的例子,这可能是我能给你的最好的。