Stata中的qfit与R中的qplot(或几何平滑?)

Stata中的qfit与R中的qplot(或几何平滑?),plot,ggplot2,stata,Plot,Ggplot2,Stata,我想画出两个变量之间的关系。我有大约15000个观察点,所以点图是没有选择的。我最初开始在Stata绘制关系图,结果达到了我的预期。我决定切换到R,并意识到我无法获得相同的结果 因此,我想知道:Stata和R中的代码有什么区别?如何从R中的Stata复制图形 在斯塔塔我试过了 twoway qfit prob1 ps1 在R我试过了 qplot(ps1,prob1, geom='smooth', xlab="temperature", ylab="probability to irrigate

我想画出两个变量之间的关系。我有大约15000个观察点,所以点图是没有选择的。我最初开始在Stata绘制关系图,结果达到了我的预期。我决定切换到R,并意识到我无法获得相同的结果

因此,我想知道:Stata和R中的代码有什么区别?如何从R中的Stata复制图形

在斯塔塔我试过了

twoway qfit prob1 ps1
在R我试过了

qplot(ps1,prob1, geom='smooth', xlab="temperature", ylab="probability to irrigate", span =0.5)
比较:左边的图是Stata中的图,右边的图是R中的图。

我还尝试了与geom_smooth的组合,例如:

library(ggplot2)
ggplot(Mydata_full, aes(ps1,prob1))  + geom_smooth()

这再次给出了非常不同的结果。我想我没有正确理解这些函数之间的所有差异。有什么提示吗

找到好的解决方案通常与使用正确的搜索词有关。我在上面的问题中指出,我不知道这些图表之间的确切区别,这表明我不知道从哪里查找。这与不阅读文档无关。尼克指出,我必须寻找二次函数,这有助于我确定搜索区域的范围。这就是解决方案:

ggplot(Mydata_full,aes(x=ps1)) +
  stat_smooth(aes(y = prob1),method = "lm", formula = y ~ x + I(x^2), size = 1)+
  scale_y_continuous(limits = c(0, 1))

比例是不同的,只要看看统计数据就知道了,y轴是完全不同的标准。人们可以看一眼,确定Stata中的双向qfit符合二次型,因此“q”表示二次型。我不是R方面的权威,但我的理解是,
qplot
中的“q”表示快速,
qplot
根本不适用于二次曲线,而是范围更广。更重要的是,这里很明显,您的R语法根本不适合二次型,而是更平滑的,很可能是lo(w)ess或lo(w)ess-like。请阅读文档。标题是错误的,因为它是
qfit
(Stata)和
qplot
(R)。为什么一条曲线向下到右边,而另一条曲线向上也是一个谜,但是如果没有一个可复制的例子,那么就只能胡思乱想了。很好,你现在知道该做什么了,但是如果你确实阅读了文档,那么不清楚双向qfit在Stata中的作用似乎很难解释。。。更有趣的是,就您的特定数据而言,为什么这些图表看起来完全不同?如果平滑图可信,那么二次曲线就不可信,反之亦然。问题可能是统计性的,那么为什么不将数据和问题发布到交叉验证上呢?