Tensorflow 如何使用张力板确定重要特征?

Tensorflow 如何使用张力板确定重要特征?,tensorflow,tensorboard,Tensorflow,Tensorboard,我有一个使用估计器api构建的二进制分类器模型。该型号有大约300个功能部件和一个标签。我使用的是一个有175个神经元的单隐层模型 我用5000个训练步骤运行模型。在划分为培训、测试和验证集之前,我有278个一类实例和178个第二类实例。它不是完全平衡的 也就是说,我得到了0.984的准确度 所以,我试图解释直方图的结果,看看是否可以用它来确定哪些特征比其他特征更重要。下面是直方图选项卡中的一些图片 这是logits的屏幕截图 根据这些屏幕截图,这些直方图似乎是来自隐藏层和登录的激活值。我不相

我有一个使用估计器api构建的二进制分类器模型。该型号有大约300个功能部件和一个标签。我使用的是一个有175个神经元的单隐层模型

我用5000个训练步骤运行模型。在划分为培训、测试和验证集之前,我有278个一类实例和178个第二类实例。它不是完全平衡的

也就是说,我得到了0.984的准确度

所以,我试图解释直方图的结果,看看是否可以用它来确定哪些特征比其他特征更重要。下面是直方图选项卡中的一些图片

这是logits的屏幕截图


根据这些屏幕截图,这些直方图似乎是来自隐藏层和登录的激活值。我不相信这会给你任何关于你的特征是如何影响模型输出的指示,因为那些直方图只是计算那些图形操作的输出值的分布

总的来说,我认为Tensorboard更适合于监视而不是分析,因为Tensorboard的主要目标是

话虽如此,Tensorflow团队构建了一个名为(TFMA)的工具,它看起来非常适合您所要做的事情:


如果您已经在使用estimator API,那么您应该能够调整代码以使用TFMA,而无需进行大量更改。这可能是一个很好的起点

如果您真的想使用Tensorboard进行此操作,您可以尝试为估计器创建一个自定义度量,例如,将您的特征作为
预测
参数传递,将您的logits激活作为
标签
参数传递。看起来很粗糙,我从未尝试过,但只是一个想法:)