Machine learning 机器学习模型的推广

Machine learning 机器学习模型的推广,machine-learning,model,knime,Machine Learning,Model,Knime,我是机器学习新手,我想问一个关于模型泛化的问题。在我的例子中,我将生产一些机械零件,我对控制输入参数感兴趣,以获得最终零件的某些属性 更具体地说,我对8个参数感兴趣(比如,P1,P2,…,P8)。为了优化所需工件的数量,以最大化所探索的参数组合,我将问题分为两组。对于第一组工件,我将改变前4个参数(P1…P4),而其他参数将保持不变。在第二种情况下,我将执行相反的操作(变量P5…P8和常量P1…P4) 所以我想知道是否有可能建立一个单一的模型,将八个参数作为输入来预测最终零件的性能。我这样问是因

我是机器学习新手,我想问一个关于模型泛化的问题。在我的例子中,我将生产一些机械零件,我对控制输入参数感兴趣,以获得最终零件的某些属性

更具体地说,我对8个参数感兴趣(比如,P1,P2,…,P8)。为了优化所需工件的数量,以最大化所探索的参数组合,我将问题分为两组。对于第一组工件,我将改变前4个参数(P1…P4),而其他参数将保持不变。在第二种情况下,我将执行相反的操作(变量P5…P8和常量P1…P4)

所以我想知道是否有可能建立一个单一的模型,将八个参数作为输入来预测最终零件的性能。我这样问是因为我不是一次改变所有8个变量,我想也许我必须为每一组参数做一个模型,而两个不同模型的预测不能相互关联


提前感谢。

在大多数情况下,使用两个不同的模型比使用一个大模型更准确。原因是,在局部模型中,模型将只查看4个特征,并能够识别其中的模式以进行预测

但这种特殊的方法肯定无法推广。现在你只有两组数据,但是如果它增加了,你有20组数据呢。您将无法在生产中创建和维护20 ML模型


什么最适合你的情况需要一些实验。从数据中随机抽取样本并训练ML模型。以一个大模型和两个本地模型为例,评估它们的性能。不仅仅是准确性,还有他们的F1成绩、AUC-PR和ROC曲线,以找出最适合你的。如果您没有看到重大性能下降,那么对于整个数据集使用一个大模型将是更好的选择。如果您知道您的数据总是分为这两组,并且您不关心可伸缩性,那么请选择两个本地模型。

我明白了。但是在使用两个模型的情况下,我想知道是否有可能将这两个模型关联起来。我的意思是,如果可以这样说:好的,如果我把下面的值输入到P1,P3,P6和P8中,我会得到属性X。这完全取决于模型和库。如果您正在发送这些属性,那么其余属性的值是多少。一些型号将接受
null
作为可接受的功能,但其他型号将抛出错误,因此您也需要这些功能的值。这对于stats.stackexchange.com来说确实是个问题。。。