Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/74.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
什么是;“抖动”;R中的函数是什么?_R - Fatal编程技术网

什么是;“抖动”;R中的函数是什么?

什么是;“抖动”;R中的函数是什么?,r,R,根据,对抖动功能的解释是“向数字向量添加少量噪声” 这是什么意思 是否有一个随机数与向量中的每个数字关联并添加到其中?抖动实际上意味着只向数值向量添加随机噪声,默认情况下,这是在抖动函数中通过从均匀分布中提取样本来完成的。如果未提供amount参数,则根据数据选择抖动中的值范围 我认为术语“抖动”包括均匀分布以外的其他分布,它通常用于更好地可视化重叠值,例如整数协变量。这有助于掌握观测密度高的地方。如果某些值出现抖动,最好在图形图例中提及,即使这种抖动很明显。下面是一个使用抖动函数以及正态分布抖

根据,对抖动功能的解释是“向数字向量添加少量噪声”

这是什么意思


是否有一个随机数与向量中的每个数字关联并添加到其中?

抖动实际上意味着只向数值向量添加随机噪声,默认情况下,这是在抖动函数中通过从均匀分布中提取样本来完成的。如果未提供amount参数,则根据数据选择抖动中的值范围

我认为术语“抖动”包括均匀分布以外的其他分布,它通常用于更好地可视化重叠值,例如整数协变量。这有助于掌握观测密度高的地方。如果某些值出现抖动,最好在图形图例中提及,即使这种抖动很明显。下面是一个使用抖动函数以及正态分布抖动的可视化示例,其中我任意输入值sd=0.1:

n <- 500
set.seed(1)
dat <- data.frame(integer = rep(1:3, each=n), continuous = c(rnorm(n, mean=1), rnorm(n, mean=2), rnorm(n, mean=3))^2)

par(mfrow=c(3,1))
plot(dat, main="No jitter for x-axis", xlab="Integer", ylab="Continuous")
plot(jitter(dat[,1]), dat[,2], main="Jittered x-axis (uniform distr.)", xlab="Integer", ylab="Continuous")
plot(dat[,1]+rnorm(3*n, sd=0.1), dat[,2], main="Jittered x-axis (normal distr.)", xlab="Integer", ylab="Continuous")

n关于抖动效应及其必要性的一个很好的解释可以在R

它利用弗朗西斯·高尔顿爵士关于父母和孩子身高关系的数据,在没有抖动的情况下,然后在抖动的情况下,将其绘制在图表上

这是一个没有抖动的(绘图(child~parent,galton)):

这是一个抖动(请忽略回归线)(绘图(抖动(孩子,4)~父母,高尔顿)):


本课程说,如果没有抖动,许多人的高度都相同,因此点彼此重叠,这就是为什么第一个情节中的一些圆看起来比其他圆暗的原因。但是,通过在儿童身高上使用R的函数“jitter”,我们可以分散数据以模拟测量误差,并使高频高度更加可见。

如果您只需在R提示符下键入
jitter
,您将能够看到该函数并了解其工作原理。谢谢,由于抖动值现在不准确,因此抖动会扭曲结果,这不是一种坏做法吗?我只是想知道为什么会想要抖动结果,因为它们现在不再正确了。我不会在统计建模中使用任何抖动,因为根据定义,它只是随机的、不想要的噪声。是的,“结果”是不准确的,但正如我提到的,在一些可视化任务中,它实际上有助于解释结果,并且是合理的;您可以将整数变量想象为一个有序因子,例如控制(=1)-轻度疾病(=2)-重度疾病(=3)。假设您想要绘制与连续变量相关的散点图,这里抖动有助于显示y轴上的变化。它可以用来支持密度图和箱线图。