R:连续变量的曲线图分布

R:连续变量的曲线图分布,r,ggplot2,R,Ggplot2,我有一个数据集,包含人们填写在线问卷所需的采访时间。 有人能告诉我,我如何绘制连续变量(geom_line)的分布图,这样我就可以 10%的参与者有10秒或更短的时间 20%的参与者有20秒或更短的时间 100%的参与者有100秒或更少的时间 假设时间是正态分布的: df您可以使用ecdf作为长度的函数给出比例: plot(ecdf(df$length)) 另一种方法是根据要求获得x轴上的比例: f <- ecdf(df$length) df$proportion <-

我有一个数据集,包含人们填写在线问卷所需的采访时间。
有人能告诉我,我如何绘制连续变量(
geom_line
)的分布图,这样我就可以

  • 10%的参与者有10秒或更短的时间
  • 20%的参与者有20秒或更短的时间

  • 100%的参与者有100秒或更少的时间
假设时间是正态分布的:


df您可以使用
ecdf
作为长度的函数给出比例:

plot(ecdf(df$length))

另一种方法是根据要求获得x轴上的比例:

f <- ecdf(df$length)
df$proportion <- f(df$length)

ggplot(df)+geom_line(aes(proportion,length))

f ggplot等价物没有
ecdf
,只需
ggplot(df,aes(length))+stat_ecdf()
(两个图非常不同…@r2evans,反过来回答OP的问题:x=比例,&谢谢你对
stat_ecdf
的评论好的,这是一种解释(我第一次读到它时没有得到),但这仍然意味着你的一个情节是错误的。但是ggplot惯用方法(如果需要避免显式调用
ecdf
),可以是
ggplot(df,aes(length))+stat\u ecdf()+coord\u flip()
。(在此之前,我不知道统计ecdf,所以我在这里学习:-)不管怎样,我投你一票:-)