Python 残差估计
我有这样一句话:Python 残差估计,python,scikit-learn,Python,Scikit Learn,我有这样一句话: attribute_est = Pipeline([ ('jsdf', DictVectorizer()), ('clf', Ridge()) ]) 我在其中传递数据,如: { 'Master_card' : 1, 'Credit_Cards': 1, 'casual_ambiance': 0, 'Classy_People': 0 } 我的模型不能很好地预测这一点。现在有人向我求婚: 你可能会发现很难找到一个好的回归者 足够地常
attribute_est = Pipeline([
('jsdf', DictVectorizer()),
('clf', Ridge())
])
我在其中传递数据,如:
{
'Master_card' : 1,
'Credit_Cards': 1,
'casual_ambiance': 0,
'Classy_People': 0
}
我的模型不能很好地预测这一点。现在有人向我求婚:
你可能会发现很难找到一个好的回归者
足够地常用的解决方案是使用线性模型来拟合线性模型
部分数据,并使用非线性模型拟合残差表示
线性模型不能拟合。建立一个残差估计器,将
另外两个估计量的一个论点。它应该使用第一个来适应
原始数据和第二个数据拟合第一个数据的残差
残差估计是什么意思?你能给我举个例子吗?A是真实数据值与某些估计器预测值之间的误差。最简单的例子是线性回归,其中残差是某些数据的最佳线性拟合与实际数据点之间的距离。直线的最小二乘拟合使这些平方残差之和最小化
您得到的建议建议建议使用两个估计器。第一个将适合数据本身。在线性回归的情况下,这是一个最小二乘线性拟合,可能使用类似的方法
然后,第二个估计器将尝试拟合残差,即数据的线性拟合与实际数据点之间的差值。在最小二乘法的情况下,这是有效地去趋势化数据,然后拟合剩余的数据。您可能会选择这是一个高斯,在这种情况下,您期望的数据实际上是一条加性高斯噪声线。但是如果你知道一些基本的噪声分布,那么就用它作为你的第二个估计器