R中的统一绘图点——研究/硬件
这是我为公共卫生硕士项目做的研究 我正在绘制数据的对比图,一个标准的x,y类型的交易,在此基础上,我正在绘制一条预测线。我得到了我认为是有史以来最时髦的点/箱线图,x轴是半填充的,我不明白为什么我不调用箱线图函数。当我调用plot函数时,我的理解是,只有点才会进行绘图 我正在绘制的数据如下所示R中的统一绘图点——研究/硬件,r,plot,R,Plot,这是我为公共卫生硕士项目做的研究 我正在绘制数据的对比图,一个标准的x,y类型的交易,在此基础上,我正在绘制一条预测线。我得到了我认为是有史以来最时髦的点/箱线图,x轴是半填充的,我不明白为什么我不调用箱线图函数。当我调用plot函数时,我的理解是,只有点才会进行绘图 我正在绘制的数据如下所示 TOTAL.LACE | DAYS.TO.FAILURE 9 | 15 16 | 7 ... | ... 总寿命的范围为0到19天,失效天数为0到30天
TOTAL.LACE | DAYS.TO.FAILURE
9 | 15
16 | 7
... | ...
总寿命的范围为0到19天,失效天数为0到30天
我的代码如下,可能是情节之前的东西,但我不认为是:
# To control the type of symbol we use we will use psymbol, it takes
# value 1 and 2
psymbol <- unique(FAILURE + 1)
# Build a test frame that will predict values of the lace score due to
# a patient being in a state of failure
test <- survreg(Surv(time = DAYS.TO.FAILURE, event = FAILURE) ~ TOTAL.LACE,
dist = "logistic")
pred <- predict(test, type="response") <-- produces numbers from about 14 to 23
summary(pred)
ord <- order(TOTAL.LACE)
tl_ord <- TOTAL.LACE[ord]
pred_ord <- pred[ord]
plot(TOTAL.LACE, DAYS.TO.FAILURE, pch=unique(psymbol)) <-- Produces goofy graph
lines(tl_ord, pred_ord) <-- this produces the line not boxplots
#为了控制我们使用的符号类型,我们将使用psymbol,它需要
#值1和2
psymbol因为你没有答案,所以很难给出一个与你的情况相关的答案。在这里,我生成了一些看起来很相似的数据:
set.seed(4)
TOTAL.LACE <- rep(1:19, each=1000)
zero.prob <- rbinom(19000, size=1, prob=.01)
DAYS.TO.FAILURE <- rpois(19000, lambda=15)
DAYS.TO.FAILURE <- ifelse(zero.prob==1, DAYS.TO.FAILURE, 0)
至于为什么你的情节是“傻乎乎的”或“看起来怪怪的”,这有点难说,因为这些术语相当模糊。我的猜测是,您需要更清楚地了解箱线图是如何工作的,然后了解这些图告诉您的数据分布情况。在a中,框的中线是数据的第50个百分位,而框的底部和顶部是第25个和第75个百分位。通常,“胡须”将延伸到最远的数据点,该数据点最多为超出方框末端的四分位间距的1.5倍。在您的情况下,对于前9个TOTAL.LACE
s,超过75%的数据是0,因此没有框,因此不可能有胡须。超出晶须限制的所有对象都将绘制为单个点。我不认为你的图是“时髦的”(尽管我承认我不知道你的意思),我认为你的数据可能是“时髦的”,你的箱线图根据箱线图的构造规则准确地表示了数据的分布
将来(我的意思是客气地说),如果你能写出更明确的问题,并包含一个可复制的例子,这将有助于你得到更有用、更快的答案
更新:感谢您提供更多信息。我认为“funky”是指它是一个箱线图,而不是一个典型的散点图。需要了解的是,plot()
是一个通用函数,它将根据传递给它的内容调用不同的方法。如果您传递简单的连续数据,它将生成散点图,但如果您传递连续数据和因子,则它将生成箱线图,即使您没有显式调用箱线图。考虑:
plot(TOTAL.LACE, DAYS.TO.FAILURE)
显然,您已将DAYS.TO.FAILURE
转换为一个没有意义的因子。这大概是在pch=unique(psymbol)
参数中通过codepsymbol“…学校驱动器上的数据”完成的?如果这是家庭作业,你应该直截了当。是的,我的观点有好有坏,我将改变标题和问题,以反映“时髦”,“x轴看起来不正确”。对于轴和预测的轴,您到底期望什么?放入str(花边)
。不要使用attach
。我现在看到您以前在前面的问题中使用过此数据集。你应该链接到它。你的代码太多了。多个打印命令,没有数据。你期望得到怎样的答案?简化代码并提供一种创建运行所需数据的方法。我将附上确切的信息,我从我的excel文件中获取了它们,并将这两列放在另一个文件中,我将添加到我的问题中,因此确切的信息就在那里,希望通过使用您的示例可以发现问题,我的TOTAL.LACE实际上是因子,所以我使用plot(as.numeric(TOTAL.LACE),DAYS.to.FAILURE)这正是我所想的。再次感谢。很高兴能帮忙,@MCP_渗透者。祝你的项目好运。
plot(TOTAL.LACE, DAYS.TO.FAILURE)
plot(as.factor(TOTAL.LACE), DAYS.TO.FAILURE)