Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/354.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 残差估计_Python_Scikit Learn - Fatal编程技术网

Python 残差估计

Python 残差估计,python,scikit-learn,Python,Scikit Learn,我有这样一句话: attribute_est = Pipeline([ ('jsdf', DictVectorizer()), ('clf', Ridge()) ]) 我在其中传递数据,如: { 'Master_card' : 1, 'Credit_Cards': 1, 'casual_ambiance': 0, 'Classy_People': 0 } 我的模型不能很好地预测这一点。现在有人向我求婚: 你可能会发现很难找到一个好的回归者 足够地常

我有这样一句话:

attribute_est = Pipeline([
     ('jsdf', DictVectorizer()),
     ('clf', Ridge())
    ])
我在其中传递数据,如:

{
  'Master_card' : 1,
  'Credit_Cards': 1,
  'casual_ambiance': 0,
  'Classy_People': 0
}
我的模型不能很好地预测这一点。现在有人向我求婚:

你可能会发现很难找到一个好的回归者 足够地常用的解决方案是使用线性模型来拟合线性模型 部分数据,并使用非线性模型拟合残差表示 线性模型不能拟合。建立一个残差估计器,将 另外两个估计量的一个论点。它应该使用第一个来适应 原始数据和第二个数据拟合第一个数据的残差

残差估计是什么意思?你能给我举个例子吗?

A是真实数据值与某些估计器预测值之间的误差。最简单的例子是线性回归,其中残差是某些数据的最佳线性拟合与实际数据点之间的距离。直线的最小二乘拟合使这些平方残差之和最小化

您得到的建议建议建议使用两个估计器。第一个将适合数据本身。在线性回归的情况下,这是一个最小二乘线性拟合,可能使用类似的方法

然后,第二个估计器将尝试拟合残差,即数据的线性拟合与实际数据点之间的差值。在最小二乘法的情况下,这是有效地去趋势化数据,然后拟合剩余的数据。您可能会选择这是一个高斯,在这种情况下,您期望的数据实际上是一条加性高斯噪声线。但是如果你知道一些基本的噪声分布,那么就用它作为你的第二个估计器