Machine learning 通过创建自己的标签进行监督学习

Machine learning 通过创建自己的标签进行监督学习,machine-learning,Machine Learning,场景-我有没有标签的数据,但我可以创建一个函数来根据行为标记数据,并部署模型,这样我就不必一直标记数据。这算是机器学习吗 目标:根据高-中-低标签对数量激增的客户进行分类,以部署在数万亿行大数据上 数据:我拥有的数据包括以下属性: 帐户、时间、日期、数量 方法: 创建一个名为spike的新功能列,并创建一个pandas函数来标识大于5的spike。这是功能工程吗 接下来,我创建标签列并将其分类为低-中-高峰值 接下来,我训练了一个机器学习分类器,并部署它来标记大数据中具有类似模式的未来客户 对这

场景-我有没有标签的数据,但我可以创建一个函数来根据行为标记数据,并部署模型,这样我就不必一直标记数据。这算是机器学习吗

目标:根据高-中-低标签对数量激增的客户进行分类,以部署在数万亿行大数据上

数据:我拥有的数据包括以下属性: 帐户、时间、日期、数量

方法:

创建一个名为spike的新功能列,并创建一个pandas函数来标识大于5的spike。这是功能工程吗

接下来,我创建标签列并将其分类为低-中-高峰值

接下来,我训练了一个机器学习分类器,并部署它来标记大数据中具有类似模式的未来客户

对这个过程有何想法?这种方法适用于机器学习吗?

第一个问题: 如果你的算法做出决定,也就是说,在样本中加入一个标签,基于你拥有的样本集,我会说这是一个机器学习算法。但是,如果您设计的代码考虑了您在数据方面的经验,那么我认为这不是一个ML方法。简言之,ML查看数据以从中获得模式和见解。我不知道你为什么这么做,但它需要是一个ML算法吗?有时,您可以用一种非常简单的方法来解决问题,而不必使用ML

第二个问题:恐怕不行。选择您的数据属性,例如:帐户、时间、日期、数量,检查它们的相关性,尝试找出您是否有一个主要的属性,等等。此过程是预ML。特征工程将选择向我们的算法呈现的最佳特征,以便在您的情况下执行分类

第三个问题:我认为开始使用一些ML算法是公平的,比如KNN、SVM、NNs、决策树等

我希望它能帮助你!
干杯

有趣的是,最近,很多报纸都把这种情况视为自我监督。。。