Machine learning 机器学习数据集相关性

Machine learning 机器学习数据集相关性,machine-learning,Machine Learning,我有一个ML模型,它有1,2,3个特性,并且工作得很好,但是现在我突然得到一个带有特性“a”的测试用例,它没有显示正确的结果,如何处理这个用例?一个详细的例子是心脏病发作预测系统,它根据体重、胆固醇水平、身高和年龄进行训练,对他们来说是正确的,但是现在我有一个病人也患有糖尿病,这增加了心脏病发作的机会。如何基于这种不相关的新特征提高精度 添加新功能并重新训练您的模型 如果您的第一个模型非常完美,您可以添加一个结构来选择模型。因此,如果患者没有糖尿病,请使用完美的模型。否则,使用另一种模式。是的,

我有一个ML模型,它有1,2,3个特性,并且工作得很好,但是现在我突然得到一个带有特性“a”的测试用例,它没有显示正确的结果,如何处理这个用例?一个详细的例子是心脏病发作预测系统,它根据体重、胆固醇水平、身高和年龄进行训练,对他们来说是正确的,但是现在我有一个病人也患有糖尿病,这增加了心脏病发作的机会。如何基于这种不相关的新特征提高精度

添加新功能并重新训练您的模型


如果您的第一个模型非常完美,您可以添加一个结构来选择模型。因此,如果患者没有糖尿病,请使用完美的模型。否则,使用另一种模式。

是的,这是一种方式,但如果我们时不时地获得新功能,就像人患有艾滋病一样,人患有癌症。。每次重新建模都是不现实的,我考虑使用给定的现有特性,然后在新特性和旧特性之间找到相关性,以增加概率。例如,糖尿病患者心脏病发作的几率增加10%,所以我只是将概率从0.4增加到0.45。我正在努力寻找同样的方法。你的观点是什么?对于药物/医生来说,传统的整合新功能的方法是进行研究、撰写、发表和同行评议论文。这个过程比再培训要长得多。如果你以一种智能的方式构建你的架构,这可能是一项任务,实际上我是从不了解ML的用户的角度说的,并将其视为用户手中的一个应用程序。他只是说他患有糖尿病/艾滋病/癌症,他想知道在这种情况下心脏病发作的几率是多少。考虑1000个请求/秒,所以我在考虑其他方法。