R 比例变换和坐标系变换的区别是什么

R 比例变换和坐标系变换的区别是什么,r,statistics,R,Statistics,在用于坐标变换的coord_trans函数的文档中,它说这个函数和scale_x_log10之间的区别是,变换发生在统计之后,而scale变换发生在统计之前,我没有得到要点。 以及如何使用这两种方法绘制数据您提供的文档中的引用告诉我们,在与绘图相关的任何统计分析之前,都会发生尺度变换 文档中提供的示例特别有用,因为它涉及回归分析。在比例变换的情况下,即使用 d <- subset(diamonds, carat > 0.5) qplot(carat, price, data = d,

在用于坐标变换的coord_trans函数的文档中,它说这个函数和scale_x_log10之间的区别是,变换发生在统计之后,而scale变换发生在统计之前,我没有得到要点。
以及如何使用这两种方法绘制数据

您提供的文档中的引用告诉我们,在与绘图相关的任何统计分析之前,都会发生尺度变换

文档中提供的示例特别有用,因为它涉及回归分析。在比例变换的情况下,即使用

d <- subset(diamonds, carat > 0.5)
qplot(carat, price, data = d, log="xy") + geom_smooth(method="lm"),

首先对未转换的数据(和轴,即独立于绘图)执行回归分析,然后使用转换后的坐标绘制所有数据。这导致回归线一点也不直,因为方程(或者更确切地说,其点的坐标)是在坐标变换过程中变换的

这在文档中通过使用进一步说明

library(scales)
qplot(carat, price, data=diamonds, log="xy") +
  geom_smooth(method="lm") +
  coord_trans(x = exp_trans(10), y = exp_trans(10))


在那里你可以看到1。使用比例变换,2。装配一条直线和3。将坐标转换回原始(线性)系统,这不会产生应有的直线。在第一个场景中,您实际拟合了一条指数曲线,该曲线在对数图上看起来笔直。

说“在变换轴上使误差最小化”是什么意思?@whoper510这意味着找到一条与点“最近”(相对于所选度量)的线。当只转换轴而不是数据时,这不会给你一个线性回归中通常想要的结果。对,我想我应该在我的问题中更具体一些。我理解通过最小化某些成本函数(例如SS误差)的值来找到最佳拟合线的想法,但轴在该过程中扮演什么角色?在学习回归时,我只看到观察到的数据起了作用(尽管我猜轴是隐式使用的)。ggplot如何在回归中明确显示轴?预测的y是在变换的尺度上还是什么?@whoper510好吧,变换轴或变换数据实际上是一回事,只是从不同的角度看。你是对的,关于尺度和数据的事情令人困惑,我试图让它更清楚。
library(scales)
qplot(carat, price, data=diamonds, log="xy") +
  geom_smooth(method="lm") +
  coord_trans(x = exp_trans(10), y = exp_trans(10))