R:连续变量的曲线图分布
我有一个数据集,包含人们填写在线问卷所需的采访时间。R:连续变量的曲线图分布,r,ggplot2,R,Ggplot2,我有一个数据集,包含人们填写在线问卷所需的采访时间。 有人能告诉我,我如何绘制连续变量(geom_line)的分布图,这样我就可以 10%的参与者有10秒或更短的时间 20%的参与者有20秒或更短的时间 100%的参与者有100秒或更少的时间 假设时间是正态分布的: df您可以使用ecdf作为长度的函数给出比例: plot(ecdf(df$length)) 另一种方法是根据要求获得x轴上的比例: f <- ecdf(df$length) df$proportion <-
有人能告诉我,我如何绘制连续变量(
geom_line
)的分布图,这样我就可以
- 10%的参与者有10秒或更短的时间
- 20%的参与者有20秒或更短的时间
- 100%的参与者有100秒或更少的时间
df您可以使用ecdf
作为长度的函数给出比例:
plot(ecdf(df$length))
另一种方法是根据要求获得x轴上的比例:
f <- ecdf(df$length)
df$proportion <- f(df$length)
ggplot(df)+geom_line(aes(proportion,length))
f ggplot等价物没有ecdf
,只需ggplot(df,aes(length))+stat_ecdf()
(两个图非常不同…@r2evans,反过来回答OP的问题:x=比例,&谢谢你对stat_ecdf
的评论好的,这是一种解释(我第一次读到它时没有得到),但这仍然意味着你的一个情节是错误的。但是ggplot惯用方法(如果需要避免显式调用ecdf
),可以是ggplot(df,aes(length))+stat\u ecdf()+coord\u flip()
。(在此之前,我不知道统计ecdf,所以我在这里学习:-)不管怎样,我投你一票:-)