Python sklearn category_编码器中的TargetEncoder和BinaryEncoder是什么?
我一直在寻找一种将分类变量矢量化的方法,然后我遇到了category_编码器。它支持多种分类方式 我试过TargetEncoder和BinaryEncoder,但文档没有对它的工作原理做太多解释Python sklearn category_编码器中的TargetEncoder和BinaryEncoder是什么?,python,python-3.x,scikit-learn,categorical-data,Python,Python 3.x,Scikit Learn,Categorical Data,我一直在寻找一种将分类变量矢量化的方法,然后我遇到了category_编码器。它支持多种分类方式 我试过TargetEncoder和BinaryEncoder,但文档没有对它的工作原理做太多解释 如果有人能解释一下目标编码器和二进制编码器是如何工作的,以及它们与热编码的区别,我真的很感激。目标编码将分类变量映射到目标变量的平均值。在使用目标时,必须采取步骤避免过度拟合(通常通过平滑完成) 二进制编码将每个整数转换为二进制数字,每个二进制数字有一列。它本质上是一种特征散列 两者都有助于降低分类变量
如果有人能解释一下目标编码器和二进制编码器是如何工作的,以及它们与热编码的区别,我真的很感激。目标编码将分类变量映射到目标变量的平均值。在使用目标时,必须采取步骤避免过度拟合(通常通过平滑完成) 二进制编码将每个整数转换为二进制数字,每个二进制数字有一列。它本质上是一种特征散列 两者都有助于降低分类变量的基数,这有助于提高某些模型的性能,尤其是基于树的模型