使用geom_bar制作条形图时,y比例与数据不匹配

使用geom_bar制作条形图时,y比例与数据不匹配,r,ggplot2,R,Ggplot2,我正在处理MPG数据集。我试图用下面的代码制作一个条形图,在X轴上有圆柱体(cyl),在y轴上有高速公路每加仑英里数(hwy) ggplot(data= mpg) + geom_bar(mapping = aes(x =cyl, y= hwy), stat = "identity") 数据集中Hwy的Y值在~20-30 mpg之间,但在我的图表上,Y轴值在0-2000之间 为什么图形中的Y值不同?这可能是因为缺少另一个变量。因为所有数量都在累积,所以得到的值很大。如果您添加

我正在处理MPG数据集。我试图用下面的代码制作一个条形图,在X轴上有圆柱体(cyl),在y轴上有高速公路每加仑英里数(hwy)

ggplot(data= mpg) +
geom_bar(mapping = aes(x =cyl, y= hwy), stat = "identity")
数据集中Hwy的Y值在~20-30 mpg之间,但在我的图表上,Y轴值在0-2000之间


为什么图形中的Y值不同?

这可能是因为缺少另一个变量。因为所有数量都在累积,所以得到的值很大。如果您添加这样的变量,您将得到您想要的:

library(tidyverse)
#Code
ggplot(data= mpg,aes(x =factor(cyl), y= hwy,fill=manufacturer)) +
  geom_bar(stat = "identity",position = position_dodge(0.9))
输出:

   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  12.00   18.00   24.00   23.44   27.00   44.00 

此时,正确显示了hwy的值:

#Code
summary(mpg$hwy)
输出:

   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  12.00   18.00   24.00   23.44   27.00   44.00 
一种仅保留两个变量并分析其关系的方法是使用
geom_point()

#Code 2
ggplot(data= mpg,aes(x =cyl, y= hwy)) +
  geom_point()
输出:

   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  12.00   18.00   24.00   23.44   27.00   44.00 

@frcaran太棒了!这取决于你如何设计绘图:)如果你认为这个答案有用,你可以点击这个答案左边的勾号来获得答案,或者你可以向上投票。这取决于你:)嗨,谢谢你的帮助!问题似乎是累积值。有没有办法在不添加其他变量的情况下修复它。我需要一个只有这两个变量的图表来检查它们之间的关系them@Frcarran这是可能的,我现在将添加一个更新!您想要的是y轴变量
hwy
必须介于实际值之间,对吗?@frcaran我添加了一个使用不同几何体的更新,该几何体仅保留两个变量!让我知道这是否对你有效!