Machine learning 高基数数据的编码

Machine learning 高基数数据的编码,machine-learning,data-science,feature-engineering,Machine Learning,Data Science,Feature Engineering,我想对分类变量进行编码,但数据具有很高的基数,因此不能选择热编码。根据我所做的研究,计数编码是一种可能的方法。这是一个回归问题,因此目标编码也不起作用。有人知道该怎么做或处理过类似的问题吗

我想对分类变量进行编码,但数据具有很高的基数,因此不能选择热编码。根据我所做的研究,计数编码是一种可能的方法。这是一个回归问题,因此目标编码也不起作用。有人知道该怎么做或处理过类似的问题吗