Machine learning 在以下场景中使用哪种分类器?

Machine learning 在以下场景中使用哪种分类器?,machine-learning,classification,Machine Learning,Classification,如果我正在建立一个天气预报器,预测明天是否会下雪,很容易直接回答“不” 显然,如果你在一年中的每一天评估这样一个分类器,它将是正确的,准确率为95%(考虑到我构建它并在很少下雪的地区进行测试) 当然,这是一个愚蠢的分类器,即使它的准确率为95%,因为预测冬季月份(1月和2月)是否会下雪显然比预测其他月份更重要 因此,如果我收集了很多关于前一天的特征来预测第二天是否会下雪,考虑到会有一个特征显示一年中的哪个月/周,我如何衡量这个特定特征并设计分类器来解决这个实际问题 当然,这是一个愚蠢的分类器,即

如果我正在建立一个天气预报器,预测明天是否会下雪,很容易直接回答“不”

显然,如果你在一年中的每一天评估这样一个分类器,它将是正确的,准确率为95%(考虑到我构建它并在很少下雪的地区进行测试)

当然,这是一个愚蠢的分类器,即使它的准确率为95%,因为预测冬季月份(1月和2月)是否会下雪显然比预测其他月份更重要

因此,如果我收集了很多关于前一天的特征来预测第二天是否会下雪,考虑到会有一个特征显示一年中的哪个月/周,我如何衡量这个特定特征并设计分类器来解决这个实际问题

当然,这是一个愚蠢的分类器,即使它的准确率为95%,因为预测冬季月份(1月和2月)是否会下雪显然比预测其他月份更重要

在您的案例中,准确度可能不是最好的衡量标准。考虑使用和

我如何衡量这一特定特征并设计分类器来解决这一实际问题

我认为你不应该以任何方式衡量任何特定的功能。您应该让您的算法这样做,并使用来确定模型的最佳参数,以避免过度拟合

如果你说JAN和FEB是最重要的月份,那就只考虑你的模型两个月吧。如果这是不可能的,考虑根据你的类的数量为它们赋予不同的权重。讨论这个问题-无论您选择何种语言,这个概念都应该是可以理解的