Machine learning 随机特征映射

Machine learning 随机特征映射,machine-learning,logistic-regression,Machine Learning,Logistic Regression,我在练习2的第二部分学习机器学习课程,我们应该使用特征映射。他们通过将特征映射到x1和x2的所有多项式项,直到六次方,添加了新的特征。然而,我的导师告诉我,我不应该使用这种算法,而是应该随机添加特性。然而,为了更好地分类,我们添加了新的特征。那么随机添加特征不会使这变得更复杂吗?那么,我们可以随机添加特征,还是应该遵循一些规则?添加新特征(例如现有特征的多项式)有助于通过使用复杂假设来减少误差。但这可能会导致过度拟合训练数据,并且可能无法在测试集上产生有效的结果 因此,为了添加新功能,应考虑以下

我在练习2的第二部分学习机器学习课程,我们应该使用特征映射。他们通过将特征映射到x1和x2的所有多项式项,直到六次方,添加了新的特征。然而,我的导师告诉我,我不应该使用这种算法,而是应该随机添加特性。然而,为了更好地分类,我们添加了新的特征。那么随机添加特征不会使这变得更复杂吗?那么,我们可以随机添加特征,还是应该遵循一些规则?

添加新特征(例如现有特征的多项式)有助于通过使用复杂假设来减少误差。但这可能会导致过度拟合训练数据,并且可能无法在测试集上产生有效的结果

因此,为了添加新功能,应考虑以下几点:

1) 通过分析结果手动选择要保留的功能

2) 另一种方法是使用所有特征,然后使用正则化,这将自动减少对目标变量贡献较少的特征的重要性,而增加对目标变量贡献较多的特征的重要性

3) 随机选择功能可能有帮助,也可能没有帮助。总是需要选择那些对目标变量贡献更大的特征。随机选择可能不是合适的解决方案

重要提示

在培训期间,始终使用验证集检查错误。 在使用多项式特征时,始终检查学习曲线,以查看模型不应过度拟合列车数据。如果发生这种情况,请尝试增加正则化参数(lambda)。正则化有助于减少过拟合。

添加新特征(例如现有特征的多项式)有助于通过使用复杂假设来减少误差。但这可能会导致过度拟合训练数据,并且可能无法在测试集上产生有效的结果

因此,为了添加新功能,应考虑以下几点:

1) 通过分析结果手动选择要保留的功能

2) 另一种方法是使用所有特征,然后使用正则化,这将自动减少对目标变量贡献较少的特征的重要性,而增加对目标变量贡献较多的特征的重要性

3) 随机选择功能可能有帮助,也可能没有帮助。总是需要选择那些对目标变量贡献更大的特征。随机选择可能不是合适的解决方案

重要提示

在培训期间,始终使用验证集检查错误。 在使用多项式特征时,始终检查学习曲线,以查看模型不应过度拟合列车数据。如果发生这种情况,请尝试增加正则化参数(lambda)。正则化有助于减少过拟合