Warning: file_get_contents(/data/phpspider/zhask/data//catemap/7/python-2.7/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Machine learning Onehot编码2500个不同的分类变量_Machine Learning_Bigdata_Classification_One Hot Encoding_Multilabel Classification - Fatal编程技术网

Machine learning Onehot编码2500个不同的分类变量

Machine learning Onehot编码2500个不同的分类变量,machine-learning,bigdata,classification,one-hot-encoding,multilabel-classification,Machine Learning,Bigdata,Classification,One Hot Encoding,Multilabel Classification,我正在做一个航班推荐项目,其中每个来源的机场代码将与一些数据一起给出。有了这些,我必须预测飞机可以到达的目的地 我必须处理600多万行。因此,在oneHotEncoding机场代码时,我面临一个问题(在当前的数据集中,机场代码超过3000个)。在将其装配到模型中之前。 有人能建议如何进行onehotencode编码或处理此类问题吗 from sklearn.preprocessing import OneHotEncoder onehotencoder1 = OneHotEncoder() on

我正在做一个航班推荐项目,其中每个来源的机场代码将与一些数据一起给出。有了这些,我必须预测飞机可以到达的目的地

我必须处理600多万行。因此,在oneHotEncoding机场代码时,我面临一个问题(在当前的数据集中,机场代码超过3000个)。在将其装配到模型中之前。 有人能建议如何进行onehotencode编码或处理此类问题吗

from sklearn.preprocessing import OneHotEncoder
onehotencoder1 = OneHotEncoder()
onehotencoder1.fit(X)
X = onehotencoder1.transform(X)
我无法分配11.3 Gib


我尝试了更少的数据,但效果很好。

您尝试过熊猫吗?它有一个类似的
get_dummies
功能,可以工作