Encoding 二进制相关性和一种热编码之间的区别?

Encoding 二进制相关性和一种热编码之间的区别?,encoding,data-mining,multilabel-classification,one-hot-encoding,Encoding,Data Mining,Multilabel Classification,One Hot Encoding,二进制相关性是处理多标签分类问题的一种众所周知的技术,在该技术中,我们针对特征的每个可能值训练一个二进制分类器: 另一方面,自然语言处理中通常使用一个热编码器(OHE)来编码以多个值作为二进制向量的分类特征: 我们可以认为这两个概念是相同的吗?还是有技术上的差异?两种方法都不同 1。一个热编码 在一个热编码中,考虑向量。 上图表示二进制分类问题 2。二元相关性 在二元相关性中,我们不考虑向量。下图表示使用二进制关联方法生成类标签,该方法使用标量值 两种方法都不同 1。一个热编码 在一个热编

二进制相关性是处理多标签分类问题的一种众所周知的技术,在该技术中,我们针对特征的每个可能值训练一个二进制分类器:

另一方面,自然语言处理中通常使用一个热编码器(OHE)来编码以多个值作为二进制向量的分类特征:


我们可以认为这两个概念是相同的吗?还是有技术上的差异?

两种方法都不同

1。一个热编码

在一个热编码中,考虑向量。

上图表示二进制分类问题

2。二元相关性

在二元相关性中,我们不考虑向量。下图表示使用二进制关联方法生成类标签,该方法使用标量值


两种方法都不同

1。一个热编码

在一个热编码中,考虑向量。

上图表示二进制分类问题

2。二元相关性

在二元相关性中,我们不考虑向量。下图表示使用二进制关联方法生成类标签,该方法使用标量值


它们在我看来完全不同。为什么您认为它们密切相关?如果您使用二进制相关性对每个类都有一个标签的数据集进行编码,看起来您对每个实例应用了一个热编码,那么向量将是所有标签的二进制值的串联。在多目标问题中,概念当然是不同的。在我看来,它们是完全不同的。为什么您认为它们密切相关?如果您使用二进制相关性对每个类都有一个标签的数据集进行编码,看起来您对每个实例应用了一个热编码,那么向量将是所有标签的二进制值的串联。在多目标问题中,概念当然不同。谢谢,这是一个详细的解释,包括powerset表示。@mountrix有关详细信息,您可以观看此视频(Udacity,Google->Deep Learning):谢谢,这是一个详细的解释,包括电源集表示。@mountrix有关详细信息,请观看此视频(Udacity,Google->Deep Learning):