Python 根据多个类别在Matplotlib中绘制散点图

Python 根据多个类别在Matplotlib中绘制散点图,python,pandas,matplotlib,plot,data-science,Python,Pandas,Matplotlib,Plot,Data Science,我有一个熊猫葡萄酒的数据框架——红葡萄酒和白葡萄酒,包括所有的化学分析数据以及它们各自的质量评级 我试图使用matplotlib绘制一个图,x轴为“质量”,y轴为“酒精含量”。我的数据包含“质量”评级的INT。我想绘制两种葡萄酒的平均质量等级(“红”或“白”,标记在“类型”列中),找出每个质量整数的平均值,除以“类型”(“红”或“白”)列 我似乎无法正确打印。在Jupyter笔记本中运行 代码如下: import matplotlib import numpy as np

我有一个熊猫葡萄酒的数据框架——红葡萄酒和白葡萄酒,包括所有的化学分析数据以及它们各自的质量评级

我试图使用matplotlib绘制一个图,x轴为“质量”,y轴为“酒精含量”。我的数据包含“质量”评级的INT。我想绘制两种葡萄酒的平均质量等级(“红”或“白”,标记在“类型”列中),找出每个质量整数的平均值,除以“类型”(“红”或“白”)列

我似乎无法正确打印。在Jupyter笔记本中运行

代码如下:

    import matplotlib
    import numpy as np
    import pandas as pd

    matplotlib.style.use('ggplot')


    df_white = pd.read_csv('data/winequality-white.csv', delimiter = ';')
    df_red = pd.read_csv('data/winequality-red.csv', delimiter = ';')

    cols_red = df_red.columns.tolist()
    cols_red = [col.lower().replace(' ','_') for col in cols_red]
    df_red.columns = cols_red

    df_red['type'] = 'red'
    df_white['type'] = 'white'

    cols_white = df_white.columns.tolist()
    cols_white = [col.lower().replace(' ','_') for col in cols_white]
    df_white.columns = cols_white

    combined_df = df_red
    combined_df = combined_df.append(df_white)

你能澄清一下你想做什么吗?我无法理解这一点:“我想绘制两种葡萄酒的平均质量等级(“红”或“白”,标记在“类型”列中)找到每个质量整数的平均值,除以“类型”列(“红”或“白”)。”耶!有很多数据点。对于某些酒精含量,有3、4种或更多的葡萄酒与之匹配。理想的做法是,不要绘制4种酒精含量为11.2%的红酒,而是绘制酒精含量为11.2%的红酒的平均质量等级。所有这些都将沿着质量的x轴和酒精含量的y轴绘制。(我希望最终能够根据酒精含量、类型(红色或白色)以及其他一些因素预测葡萄酒的质量,这取决于模型。@PrestonH这就是我试图绘制的内容。。如果这有帮助的话。
pd.pivot\u表(组合的df,values='quality',index='alcohold',columns='type',aggfunc=np.mean)