Machine learning 数据挖掘、机器学习:单击使用Logit的预测

Machine learning 数据挖掘、机器学习:单击使用Logit的预测,machine-learning,data-mining,Machine Learning,Data Mining,我是个笨蛋。我手头有一项任务,就是根据城市、州、操作系统版本、操作系统系列、设备、浏览器系列、浏览器版本、城市等用户信息预测点击概率。 有人建议我试试logit,因为logit似乎也是微软和谷歌正在使用的。 我有一些关于逻辑回归的问题,如: 单击和非单击是一个非常不平衡的类,简单的glm预测看起来不太好。如何使数据通过此方式工作 我所有的变量都是分类的,像设备和城市这样的东西可以有很多。此外,某些设备或某些城市的出现频率可能非常低。那么,如何处理我所能说的是一系列非常随机的分类变量呢 我们得到的

我是个笨蛋。我手头有一项任务,就是根据城市、州、操作系统版本、操作系统系列、设备、浏览器系列、浏览器版本、城市等用户信息预测点击概率。 有人建议我试试logit,因为logit似乎也是微软和谷歌正在使用的。 我有一些关于逻辑回归的问题,如:

单击和非单击是一个非常不平衡的类,简单的glm预测看起来不太好。如何使数据通过此方式工作

我所有的变量都是分类的,像设备和城市这样的东西可以有很多。此外,某些设备或某些城市的出现频率可能非常低。那么,如何处理我所能说的是一系列非常随机的分类变量呢


我们得到的变量之一是设备id。这是一个非常独特的功能,可以转换为用户的身份。如何在logit中使用它,或者应该根据用户身份在完全不同的模型中使用它?

考虑将此移动到发布位置,谢谢!