Machine learning 通过创建自己的标签进行监督学习_Machine Learning

Machine learning 通过创建自己的标签进行监督学习

machine-learning

Machine learning 通过创建自己的标签进行监督学习,machine-learning,Machine Learning,场景-我有没有标签的数据，但我可以创建一个函数来根据行为标记数据，并部署模型，这样我就不必一直标记数据。这算是机器学习吗目标：根据高-中-低标签对数量激增的客户进行分类，以部署在数万亿行大数据上数据：我拥有的数据包括以下属性：帐户、时间、日期、数量方法：创建一个名为spike的新功能列，并创建一个pandas函数来标识大于5的spike。这是功能工程吗接下来，我创建标签列并将其分类为低-中-高峰值接下来，我训练了一个机器学习分类器，并部署它来标记大数据中具有类似模式的未来客户对这

场景-我有没有标签的数据，但我可以创建一个函数来根据行为标记数据，并部署模型，这样我就不必一直标记数据。这算是机器学习吗

目标：根据高-中-低标签对数量激增的客户进行分类，以部署在数万亿行大数据上

数据：我拥有的数据包括以下属性：帐户、时间、日期、数量

方法：

创建一个名为spike的新功能列，并创建一个pandas函数来标识大于5的spike。这是功能工程吗

接下来，我创建标签列并将其分类为低-中-高峰值

接下来，我训练了一个机器学习分类器，并部署它来标记大数据中具有类似模式的未来客户

对这个过程有何想法？这种方法适用于机器学习吗？

第一个问题：如果你的算法做出决定，也就是说，在样本中加入一个标签，基于你拥有的样本集，我会说这是一个机器学习算法。但是，如果您设计的代码考虑了您在数据方面的经验，那么我认为这不是一个ML方法。简言之，ML查看数据以从中获得模式和见解。我不知道你为什么这么做，但它需要是一个ML算法吗？有时，您可以用一种非常简单的方法来解决问题，而不必使用ML

第二个问题：恐怕不行。选择您的数据属性，例如：帐户、时间、日期、数量，检查它们的相关性，尝试找出您是否有一个主要的属性，等等。此过程是预ML。特征工程将选择向我们的算法呈现的最佳特征，以便在您的情况下执行分类

第三个问题：我认为开始使用一些ML算法是公平的，比如KNN、SVM、NNs、决策树等

我希望它能帮助你！

干杯

有趣的是，最近，很多报纸都把这种情况视为自我监督。。。