Machine learning 机器学习模型的推广_Machine Learning_Model_Knime

Machine learning 机器学习模型的推广

machine-learning model

Machine learning 机器学习模型的推广,machine-learning,model,knime,Machine Learning,Model,Knime,我是机器学习新手，我想问一个关于模型泛化的问题。在我的例子中，我将生产一些机械零件，我对控制输入参数感兴趣，以获得最终零件的某些属性更具体地说，我对8个参数感兴趣（比如，P1，P2，…，P8）。为了优化所需工件的数量，以最大化所探索的参数组合，我将问题分为两组。对于第一组工件，我将改变前4个参数（P1…P4），而其他参数将保持不变。在第二种情况下，我将执行相反的操作（变量P5…P8和常量P1…P4）所以我想知道是否有可能建立一个单一的模型，将八个参数作为输入来预测最终零件的性能。我这样问是因

我是机器学习新手，我想问一个关于模型泛化的问题。在我的例子中，我将生产一些机械零件，我对控制输入参数感兴趣，以获得最终零件的某些属性

更具体地说，我对8个参数感兴趣（比如，P1，P2，…，P8）。为了优化所需工件的数量，以最大化所探索的参数组合，我将问题分为两组。对于第一组工件，我将改变前4个参数（P1…P4），而其他参数将保持不变。在第二种情况下，我将执行相反的操作（变量P5…P8和常量P1…P4）

所以我想知道是否有可能建立一个单一的模型，将八个参数作为输入来预测最终零件的性能。我这样问是因为我不是一次改变所有8个变量，我想也许我必须为每一组参数做一个模型，而两个不同模型的预测不能相互关联

提前感谢。

在大多数情况下，使用两个不同的模型比使用一个大模型更准确。原因是，在局部模型中，模型将只查看4个特征，并能够识别其中的模式以进行预测

但这种特殊的方法肯定无法推广。现在你只有两组数据，但是如果它增加了，你有20组数据呢。您将无法在生产中创建和维护20 ML模型

什么最适合你的情况需要一些实验。从数据中随机抽取样本并训练ML模型。以一个大模型和两个本地模型为例，评估它们的性能。不仅仅是准确性，还有他们的F1成绩、AUC-PR和ROC曲线，以找出最适合你的。如果您没有看到重大性能下降，那么对于整个数据集使用一个大模型将是更好的选择。如果您知道您的数据总是分为这两组，并且您不关心可伸缩性，那么请选择两个本地模型。

我明白了。但是在使用两个模型的情况下，我想知道是否有可能将这两个模型关联起来。我的意思是，如果可以这样说：好的，如果我把下面的值输入到P1，P3，P6和P8中，我会得到属性X。这完全取决于模型和库。如果您正在发送这些属性，那么其余属性的值是多少。一些型号将接受

null

作为可接受的功能，但其他型号将抛出错误，因此您也需要这些功能的值。这对于stats.stackexchange.com来说确实是个问题。。。