Python 什么是一个热编码器';的分类功能用于?
因此,我使用一个热编码器对数据中的一个分类特征进行编码,但我无法理解其中的参数。你们能帮我做点什么吗,它是用来干什么的。参数为:分类特征=[0]Python 什么是一个热编码器';的分类功能用于?,python,machine-learning,Python,Machine Learning,因此,我使用一个热编码器对数据中的一个分类特征进行编码,但我无法理解其中的参数。你们能帮我做点什么吗,它是用来干什么的。参数为:分类特征=[0] from sklearn.preprocessing import OneHotEncoder onehotencoder = OneHotEncoder(categorical_features= [0]) X = onehotencoder.fit_transform(X).toarray() 如果您想更深入地了解这一点,可以参考这一点。OneH
from sklearn.preprocessing import OneHotEncoder
onehotencoder = OneHotEncoder(categorical_features= [0])
X = onehotencoder.fit_transform(X).toarray()
如果您想更深入地了解这一点,可以参考这一点。OneHotEncoder的目标是将分类整数特征编码为一个单选数字数组。如中所述,
category_features
参数用于:
指定哪些功能被视为分类功能
如果我们希望直接将所有特征(即分类特征和数字特征)提供给编码器,并将我们想要的特征集指定为一个热特征,则可以使用这种方法。下面是一个如何使用它的示例:
df = pd.DataFrame({'col1':[4,5,6], 'col2':[1,2,3]})
onehotencoder = OneHotEncoder(categorical_features= [True, False])
onehotencoder.fit_transform(df.values).toarray()
array([[1., 0., 0., 1.],
[0., 1., 0., 2.],
[0., 0., 1., 3.]])
在本例中,我们指定了一个
掩码
,指示我们希望将哪些特性作为一个热特性,因此在本例中是第一个Category_features
也适用于一系列索引,Category_features=[0]
将产生相同的结果。中对此参数进行了很好的解释
指定哪些功能被视为分类功能
“全部”:所有功能都被视为分类功能
索引数组:分类特征索引数组
掩码:长度n_特征数组,dtype=bool
顺便说一句,此参数将被弃用
自版本0.20以来已弃用:Category_features关键字在版本0.20中已弃用,将在0.22中删除。您可以使用列转换器
机器学习的特点是什么?这些是输入或测量的独立变量。功能的数量是我们定义的。
我们对特征进行一次热编码,以表示特征是独立的。一次热编码只是嵌入的一种类型;)虽然此链接可以回答问题,但最好在此处包含答案的基本部分,并提供链接供参考。如果链接页面发生更改,仅链接的答案可能无效。-我同意这一点。我曾经遇到过这个问题,我提供了链接。现在我已经把链接和内容,可以帮助解决这个问题
df = pd.DataFrame({'col1':[4,5,6], 'col2':[1,2,3]})
onehotencoder = OneHotEncoder(categorical_features= [True, False])
onehotencoder.fit_transform(df.values).toarray()
array([[1., 0., 0., 1.],
[0., 1., 0., 2.],
[0., 0., 1., 3.]])