Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/visual-studio/7.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python sklearn category_编码器中的TargetEncoder和BinaryEncoder是什么?_Python_Python 3.x_Scikit Learn_Categorical Data - Fatal编程技术网

Python sklearn category_编码器中的TargetEncoder和BinaryEncoder是什么?

Python sklearn category_编码器中的TargetEncoder和BinaryEncoder是什么?,python,python-3.x,scikit-learn,categorical-data,Python,Python 3.x,Scikit Learn,Categorical Data,我一直在寻找一种将分类变量矢量化的方法,然后我遇到了category_编码器。它支持多种分类方式 我试过TargetEncoder和BinaryEncoder,但文档没有对它的工作原理做太多解释 如果有人能解释一下目标编码器和二进制编码器是如何工作的,以及它们与热编码的区别,我真的很感激。目标编码将分类变量映射到目标变量的平均值。在使用目标时,必须采取步骤避免过度拟合(通常通过平滑完成) 二进制编码将每个整数转换为二进制数字,每个二进制数字有一列。它本质上是一种特征散列 两者都有助于降低分类变量

我一直在寻找一种将分类变量矢量化的方法,然后我遇到了category_编码器。它支持多种分类方式

我试过TargetEncoder和BinaryEncoder,但文档没有对它的工作原理做太多解释


如果有人能解释一下目标编码器和二进制编码器是如何工作的,以及它们与热编码的区别,我真的很感激。

目标编码将分类变量映射到目标变量的平均值。在使用目标时,必须采取步骤避免过度拟合(通常通过平滑完成)

二进制编码将每个整数转换为二进制数字,每个二进制数字有一列。它本质上是一种特征散列

两者都有助于降低分类变量的基数,这有助于提高某些模型的性能,尤其是基于树的模型