ggplot geom_直方图在Python和R之间的行为不同
我试图做一些探索性的数据分析,我有一个数据框架,其中有一个整数年龄列和一个“类别”列。制作年龄直方图很容易。我想做的是维护这个年龄直方图,但根据分类变量给条形图上色ggplot geom_直方图在Python和R之间的行为不同,python,r,ggplot2,histogram,Python,R,Ggplot2,Histogram,我试图做一些探索性的数据分析,我有一个数据框架,其中有一个整数年龄列和一个“类别”列。制作年龄直方图很容易。我想做的是维护这个年龄直方图,但根据分类变量给条形图上色 import numpy as np import pandas as pd ageSeries.hist(bins=np.arange(-0.5, 116.5, 1)) 在R中使用ggplot2,我可以在一行中轻松完成我想要的任务 ggplot(data, aes(x=Age, fill=Category)) + geom_h
import numpy as np
import pandas as pd
ageSeries.hist(bins=np.arange(-0.5, 116.5, 1))
在R中使用ggplot2,我可以在一行中轻松完成我想要的任务
ggplot(data, aes(x=Age, fill=Category)) + geom_histogram(binwidth = 1)
我无法在Python中找到一个好的解决方案,但后来我意识到有一个用于Python的ggplot2库,并安装了它。我试着用同样的ggplot命令
ggplot(data, aes(x="Age", fill="Category")) + geom_histogram(binwidth = 1)
查看这些结果,我们可以看到不同的类别被视为不同的系列和重叠,而不是堆叠。我不想乱搞透明植物,我仍然想保持人口的总体分布
这是我可以用ggplot调用中的一个参数来解决的问题,还是在Python中有一种简单的方法来解决这一问题,而无需进行大量额外的数据帧操作