Artificial intelligence 如何消除;“不必要的”;神经网络的价值观?

Artificial intelligence 如何消除;“不必要的”;神经网络的价值观?,artificial-intelligence,neural-network,Artificial Intelligence,Neural Network,我的教授让我们班制作一个神经网络来预测乳腺癌是良性还是恶性。要做到这一点,我正在使用 作为这样做的一个提示,我的教授说,并非所有30个心房都需要用作输入(有32个,但前2个是ID和诊断),我想问的是:我应该如何接受这30个输入(根据我使用的神经元数量,这将产生100多个权重)并将它们减少到一个较小的数量 我已经找到了如何“修剪”神经网络,但我认为这不是我想要的。我不是要消除不必要的神经元,而是要减少输入本身 PS:对不起,有任何英语错误,这不是我的母语。这个问题叫做。对于神经网络和其他分类器来说

我的教授让我们班制作一个神经网络来预测乳腺癌是良性还是恶性。要做到这一点,我正在使用

作为这样做的一个提示,我的教授说,并非所有30个心房都需要用作输入(有32个,但前2个是ID和诊断),我想问的是:我应该如何接受这30个输入(根据我使用的神经元数量,这将产生100多个权重)并将它们减少到一个较小的数量

我已经找到了如何“修剪”神经网络,但我认为这不是我想要的。我不是要消除不必要的神经元,而是要减少输入本身

PS:对不起,有任何英语错误,这不是我的母语。

这个问题叫做。对于神经网络和其他分类器来说,这基本上是相同的。您可以使用PCA在保留最大差异的同时修剪数据集。更进一步,您可以使用贪婪的方法,通过依次排除每个特征来训练和测试网络,逐个评估您的特征。

有一种仅使用神经网络的
特征选择技术
将数据集分为三组:

  • 用于监督培训的培训数据
  • 验证数据用于验证神经网络的泛化能力
  • 精度测试用于测试哪些功能是必需的
步骤如下:
  • 在您的培训和验证集上培训一个网络,就像您通常所做的那样
  • 使用第三个数据集测试网络的准确性
  • 找到在上述精度测试中下降幅度最小的变量(下降意味着始终输入零作为输入信号)
  • 使用新选择的功能重新训练网络
  • 继续这样做,要么是因为网络没有得到训练,要么就是只剩下一个变量

  • 这是一个正在研究中的问题。它被称为特征选择,已经有了一些技术。一种是
    主成分分析(PCA)
    ,它利用保持最大差异的特征来降低数据集的维度。你可以做的另一件事是看看是否有高度相关的变量。如果两个输入高度相关,则可能意味着它们携带几乎相同的信息,因此可以删除这些信息,而不会严重影响分类器的性能。作为第三种技巧,您可以使用
    深度学习
    ,这是一种尝试学习稍后将用于培训师的功能的技巧。关于深度学习和PCA的更多信息可以在这里找到

    我认为有30个属性,一个接一个地检查它们可能是一场灾难。你可以做一个PCA,然后开始训练1,2,3。。。最佳功能,选择在更短时间内为您提供最佳准确性的功能。