Python 根据多个类别在Matplotlib中绘制散点图_Python_Pandas_Matplotlib_Plot_Data Science

Python 根据多个类别在Matplotlib中绘制散点图

python pandas matplotlib plot

Python 根据多个类别在Matplotlib中绘制散点图,python,pandas,matplotlib,plot,data-science,Python,Pandas,Matplotlib,Plot,Data Science,我有一个熊猫葡萄酒的数据框架——红葡萄酒和白葡萄酒，包括所有的化学分析数据以及它们各自的质量评级我试图使用matplotlib绘制一个图，x轴为“质量”，y轴为“酒精含量”。我的数据包含“质量”评级的INT。我想绘制两种葡萄酒的平均质量等级（“红”或“白”，标记在“类型”列中），找出每个质量整数的平均值，除以“类型”（“红”或“白”）列我似乎无法正确打印。在Jupyter笔记本中运行代码如下： import matplotlib import numpy as np

我有一个熊猫葡萄酒的数据框架——红葡萄酒和白葡萄酒，包括所有的化学分析数据以及它们各自的质量评级

我试图使用matplotlib绘制一个图，x轴为“质量”，y轴为“酒精含量”。我的数据包含“质量”评级的INT。我想绘制两种葡萄酒的平均质量等级（“红”或“白”，标记在“类型”列中），找出每个质量整数的平均值，除以“类型”（“红”或“白”）列

我似乎无法正确打印。在Jupyter笔记本中运行

代码如下：

    import matplotlib
    import numpy as np
    import pandas as pd

    matplotlib.style.use('ggplot')


    df_white = pd.read_csv('data/winequality-white.csv', delimiter = ';')
    df_red = pd.read_csv('data/winequality-red.csv', delimiter = ';')

    cols_red = df_red.columns.tolist()
    cols_red = [col.lower().replace(' ','_') for col in cols_red]
    df_red.columns = cols_red

    df_red['type'] = 'red'
    df_white['type'] = 'white'

    cols_white = df_white.columns.tolist()
    cols_white = [col.lower().replace(' ','_') for col in cols_white]
    df_white.columns = cols_white

    combined_df = df_red
    combined_df = combined_df.append(df_white)

你能澄清一下你想做什么吗？我无法理解这一点：“我想绘制两种葡萄酒的平均质量等级（“红”或“白”，标记在“类型”列中）找到每个质量整数的平均值，除以“类型”列（“红”或“白”）。”耶！有很多数据点。对于某些酒精含量，有3、4种或更多的葡萄酒与之匹配。理想的做法是，不要绘制4种酒精含量为11.2%的红酒，而是绘制酒精含量为11.2%的红酒的平均质量等级。所有这些都将沿着质量的x轴和酒精含量的y轴绘制。（我希望最终能够根据酒精含量、类型（红色或白色）以及其他一些因素预测葡萄酒的质量，这取决于模型。@PrestonH这就是我试图绘制的内容。。如果这有帮助的话。

pd.pivot\u表（组合的df，values='quality'，index='alcohold'，columns='type'，aggfunc=np.mean）