在python中,如何将第三个变量绘制为hexbin上的颜色?
让我们使用著名的泰坦尼克号数据集: 并将其作为数据帧读入:在python中,如何将第三个变量绘制为hexbin上的颜色?,python,matplotlib,Python,Matplotlib,让我们使用著名的泰坦尼克号数据集: 并将其作为数据帧读入:df 我感兴趣的是可视化每个乘客段的存活率,乘客段被定义为一个包含票价x年龄 生成这两个特性的hexbin非常简单: sns.set(font_scale=1.5) sns.set_style("white") fig = plt.figure(figsize=(8,8)) fig = sns.jointplot("age", "fare", data=df, kind="hex", joint_kws={
df
我感兴趣的是可视化每个乘客段的存活率,乘客段被定义为一个包含票价
x年龄
生成这两个特性的hexbin非常简单:
sns.set(font_scale=1.5)
sns.set_style("white")
fig = plt.figure(figsize=(8,8))
fig = sns.jointplot("age", "fare", data=df, kind="hex",
joint_kws={'gridsize':22},
xlim=(-20, 90), ylim=(-20,300), mincnt=0,
stat_func=None, marginal_kws={"bins":10, "color":"k", "rug":True}, color="black"
)
但是,我希望图表的颜色代表每个箱子内计数的所有乘客的存活率(存活
是一个二进制1&0数据帧特征),而不是密度(不管怎样,它显示在边缘图中)
答案有些帮助,但散点图对于密集的数据集是有问题的,因此我使用了hexbin
有什么可以帮我的忙吗?Hexbin可以接受
C
input()中的任何东西,但我不确定如何说服seaborn接受不同的值。一个非编程问题是,这是一种标准的绘图格式,其原因被称为“边际分布”。如果不希望边缘打印连接到内部打印,则可能应该在不同的轴上打印它们。否则就很难从你的另一个意思中分离出通常的意思。