Machine learning 选择什么机器学习模型?

Machine learning 选择什么机器学习模型?,machine-learning,neural-network,bigdata,Machine Learning,Neural Network,Bigdata,我有一个.csv格式的表,其中包括以下列: recipe, defect, material1, material2, material3, ..., material122 配方是一种或多种材料组合的ID(例如,配方_1对应于材料1+材料3+材料28,而配方_2对应于材料3+材料5) 缺陷是一个ID,表示使用某个配方制造的某些产品中发现的缺陷 材料n是某种材料的重量。但是,我使用了材料的比例,而不是它们的重量(例如,我说材料1=0.25,材料2=0.75,而不是说给定配方的材料1=5 kg,

我有一个.csv格式的表,其中包括以下列:

recipe, defect, material1, material2, material3, ..., material122
  • 配方是一种或多种材料组合的ID(例如,配方_1对应于材料1+材料3+材料28,而配方_2对应于材料3+材料5)
  • 缺陷是一个ID,表示使用某个配方制造的某些产品中发现的缺陷
  • 材料n是某种材料的重量。但是,我使用了材料的比例,而不是它们的重量(例如,我说材料1=0.25,材料2=0.75,而不是说给定配方的材料1=5 kg,材料2=15 kg=material1+material2)
  • 注意:同一配方可能存在多个缺陷

    它包括124列和近90000行

    现在,我需要训练一些模型,使用material1、material2、material3、…、material122作为输入,缺陷作为输出。例如,让我们从我的文件中获取第2-15行:

    given input: [0, 0, 0.898, 0.062, 0.039, 0, 0, ..., 0, 0] // ratios of materials for recipe 1701192
    given output: [149, 146, 148, 90, 89, ..., 59, 71, 63] // defects found for recipe 1701192
    
    我在这里看到的主要问题是,相同的配方对应不同的缺陷。此外,我需要预测另一个文件中给出的测试数据集中的多个缺陷

    它包括123列和8400行。请注意,没有关于缺陷的信息-我需要预测它们


    不幸的是,我不知道有哪些模型允许对某些属性组合进行多个预测。你能推荐点什么吗?它也可以是一个神经网络。

    一种方法是进行多元回归。如果您知道将发生的所有缺陷类型(类别),那么您可以将它们作为“n”因变量,然后对数据执行回归。 在运行回归之前,您应该做的一件事是标准化或规范化您的输入数据(如果您还没有这样做的话)。如果您的所有输出变量彼此独立,那么您也可以在模型中对它们中的每一个运行单独的分析