Python 根据多个类别在Matplotlib中绘制散点图
我有一个熊猫葡萄酒的数据框架——红葡萄酒和白葡萄酒,包括所有的化学分析数据以及它们各自的质量评级 我试图使用matplotlib绘制一个图,x轴为“质量”,y轴为“酒精含量”。我的数据包含“质量”评级的INT。我想绘制两种葡萄酒的平均质量等级(“红”或“白”,标记在“类型”列中),找出每个质量整数的平均值,除以“类型”(“红”或“白”)列 我似乎无法正确打印。在Jupyter笔记本中运行 代码如下:Python 根据多个类别在Matplotlib中绘制散点图,python,pandas,matplotlib,plot,data-science,Python,Pandas,Matplotlib,Plot,Data Science,我有一个熊猫葡萄酒的数据框架——红葡萄酒和白葡萄酒,包括所有的化学分析数据以及它们各自的质量评级 我试图使用matplotlib绘制一个图,x轴为“质量”,y轴为“酒精含量”。我的数据包含“质量”评级的INT。我想绘制两种葡萄酒的平均质量等级(“红”或“白”,标记在“类型”列中),找出每个质量整数的平均值,除以“类型”(“红”或“白”)列 我似乎无法正确打印。在Jupyter笔记本中运行 代码如下: import matplotlib import numpy as np
import matplotlib
import numpy as np
import pandas as pd
matplotlib.style.use('ggplot')
df_white = pd.read_csv('data/winequality-white.csv', delimiter = ';')
df_red = pd.read_csv('data/winequality-red.csv', delimiter = ';')
cols_red = df_red.columns.tolist()
cols_red = [col.lower().replace(' ','_') for col in cols_red]
df_red.columns = cols_red
df_red['type'] = 'red'
df_white['type'] = 'white'
cols_white = df_white.columns.tolist()
cols_white = [col.lower().replace(' ','_') for col in cols_white]
df_white.columns = cols_white
combined_df = df_red
combined_df = combined_df.append(df_white)
你能澄清一下你想做什么吗?我无法理解这一点:“我想绘制两种葡萄酒的平均质量等级(“红”或“白”,标记在“类型”列中)找到每个质量整数的平均值,除以“类型”列(“红”或“白”)。”耶!有很多数据点。对于某些酒精含量,有3、4种或更多的葡萄酒与之匹配。理想的做法是,不要绘制4种酒精含量为11.2%的红酒,而是绘制酒精含量为11.2%的红酒的平均质量等级。所有这些都将沿着质量的x轴和酒精含量的y轴绘制。(我希望最终能够根据酒精含量、类型(红色或白色)以及其他一些因素预测葡萄酒的质量,这取决于模型。@PrestonH这就是我试图绘制的内容。。如果这有帮助的话。
pd.pivot\u表(组合的df,values='quality',index='alcohold',columns='type',aggfunc=np.mean)