Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/348.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/assembly/6.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 什么是一个热编码器';的分类功能用于?_Python_Machine Learning - Fatal编程技术网

Python 什么是一个热编码器';的分类功能用于?

Python 什么是一个热编码器';的分类功能用于?,python,machine-learning,Python,Machine Learning,因此,我使用一个热编码器对数据中的一个分类特征进行编码,但我无法理解其中的参数。你们能帮我做点什么吗,它是用来干什么的。参数为:分类特征=[0] from sklearn.preprocessing import OneHotEncoder onehotencoder = OneHotEncoder(categorical_features= [0]) X = onehotencoder.fit_transform(X).toarray() 如果您想更深入地了解这一点,可以参考这一点。OneH

因此,我使用一个热编码器对数据中的一个分类特征进行编码,但我无法理解其中的参数。你们能帮我做点什么吗,它是用来干什么的。参数为:分类特征=[0]

from sklearn.preprocessing import OneHotEncoder
onehotencoder = OneHotEncoder(categorical_features= [0])
X = onehotencoder.fit_transform(X).toarray()

如果您想更深入地了解这一点,可以参考这一点。OneHotEncoder的目标是将分类整数特征编码为一个单选数字数组。如中所述,
category_features
参数用于:

指定哪些功能被视为分类功能

如果我们希望直接将所有特征(即分类特征和数字特征)提供给编码器,并将我们想要的特征集指定为一个热特征,则可以使用这种方法。下面是一个如何使用它的示例:

df = pd.DataFrame({'col1':[4,5,6], 'col2':[1,2,3]})

onehotencoder = OneHotEncoder(categorical_features= [True, False])
onehotencoder.fit_transform(df.values).toarray()

array([[1., 0., 0., 1.],
       [0., 1., 0., 2.],
       [0., 0., 1., 3.]])

在本例中,我们指定了一个
掩码
,指示我们希望将哪些特性作为一个热特性,因此在本例中是第一个
Category_features
也适用于一系列索引,
Category_features=[0]
将产生相同的结果。

中对此参数进行了很好的解释

指定哪些功能被视为分类功能

“全部”:所有功能都被视为分类功能

索引数组:分类特征索引数组

掩码:长度n_特征数组,dtype=bool

顺便说一句,此参数将被弃用

自版本0.20以来已弃用:Category_features关键字在版本0.20中已弃用,将在0.22中删除。您可以使用
列转换器

机器学习的特点是什么?这些是输入或测量的独立变量。功能的数量是我们定义的。
我们对特征进行一次热编码,以表示特征是独立的。

一次热编码只是嵌入的一种类型;)虽然此链接可以回答问题,但最好在此处包含答案的基本部分,并提供链接供参考。如果链接页面发生更改,仅链接的答案可能无效。-我同意这一点。我曾经遇到过这个问题,我提供了链接。现在我已经把链接和内容,可以帮助解决这个问题
df = pd.DataFrame({'col1':[4,5,6], 'col2':[1,2,3]})

onehotencoder = OneHotEncoder(categorical_features= [True, False])
onehotencoder.fit_transform(df.values).toarray()

array([[1., 0., 0., 1.],
       [0., 1., 0., 2.],
       [0., 0., 1., 3.]])