Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/algorithm/11.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Matplotlib 如何根据分类输入变量可视化(绘制)回归输出?_Matplotlib_Machine Learning_Regression_Linear Regression_Categorical Data - Fatal编程技术网

Matplotlib 如何根据分类输入变量可视化(绘制)回归输出?

Matplotlib 如何根据分类输入变量可视化(绘制)回归输出?,matplotlib,machine-learning,regression,linear-regression,categorical-data,Matplotlib,Machine Learning,Regression,Linear Regression,Categorical Data,我在做多元线性回归。在我的数据中,我有n=143特征和m=13000训练示例。我的一些功能是连续(顺序)变量(面积、年份、房间数)。但我也有分类变量(地区、颜色、类型)。现在,我把我的一些想法和预期的价格进行了对比。例如,这里是根据预测的价格绘制的面积: 因为区域是连续的顺序变量,所以我在可视化数据时没有遇到任何问题。但现在我想以某种方式形象化我的分类变量(如地区)对预测价格的依赖性。 对于分类变量,我使用了一种热(虚拟)编码。 例如,此类数据: 转到此格式: 如果我用这种方式对地区进行顺

我在做多元线性回归。在我的数据中,我有n=143特征和m=13000训练示例。我的一些功能是连续(顺序)变量(面积、年份、房间数)。但我也有分类变量(地区、颜色、类型)。现在,我把我的一些想法和预期的价格进行了对比。例如,这里是根据预测的
价格绘制的
面积

因为
区域
是连续的顺序变量,所以我在可视化数据时没有遇到任何问题。但现在我想以某种方式形象化我的分类变量(如地区)对预测价格的依赖性。 对于分类变量,我使用了一种热(虚拟)编码。
例如,此类数据:

转到此格式:

如果我用这种方式对地区进行顺序编码:

DistrictA - 1
DistrictB - 2
DistrictC - 3
DistrictD - 4
DistrictE - 5
我将把1-5放在X轴上,把价格放在Y轴上,很容易地把这个值与预测价格进行比较

但我使用了虚拟编码,现在我不知道如何显示(可视化)价格和分类变量‘地区’之间的依赖关系,以一系列零和一表示


在使用虚拟编码的情况下,我如何绘制区域与预测价格的回归线图?

如果您只想知道不同区域对预测的影响程度,可以直接查看经过训练的系数。高θ表示该地区提高了价格


如果要绘制此图,一种可能的方法是根据设置的区域,使用x坐标绘制散点图。 类似这样(未经测试):

等等。 (可能需要提供与过滤数据向量大小相同的x向量。)
如果你能在x坐标上添加一点随机扰动,效果会更好。

交叉发布在Stats.SE和DataScience.SE:。请每个社区都应该有一个诚实的机会来回答这个问题,而不会浪费任何人的时间。我投票结束这个问题,因为它已经发布在多个Stack Exchange网站上。
plot.scatter(0, predict(data["DistrictA"==1]))
plot.scatter(1, predict(data["DistrictB"==1]))