Machine learning 如何识别数据集上的可变目标,以便使用机器学习进行预测

Machine learning 如何识别数据集上的可变目标,以便使用机器学习进行预测,machine-learning,decision-tree,Machine Learning,Decision Tree,我正在做一个项目,使用决策树从日志中预测攻击 问题是在规范化日志文件之后,我不知道如何识别输出类,以便将从决策树获得的结果与实际结果进行比较 说实话,我不知道如何识别真正的班级 我是否需要关联以识别类 谢谢你的帮助你的问题不清楚。如果您可以共享您想要的日志或结果数据集,那就太好了 但是,您可以检查是否遵循分类或回归。它们之间的主要区别在于回归中的输出变量是数值的(或连续的),而分类中的输出变量是分类的(或离散的) 因此,请检查完整描述上述内容的列(分类或回归)thank's@Running Ra

我正在做一个项目,使用决策树从日志中预测攻击

问题是在规范化日志文件之后,我不知道如何识别输出类,以便将从决策树获得的结果与实际结果进行比较

说实话,我不知道如何识别真正的班级

我是否需要关联以识别类


谢谢你的帮助

你的问题不清楚。如果您可以共享您想要的日志或结果数据集,那就太好了

但是,您可以检查是否遵循分类或回归。它们之间的主要区别在于回归中的输出变量是数值的(或连续的),而分类中的输出变量是分类的(或离散的)


因此,请检查完整描述上述内容的列(分类或回归)

thank's@Running Rabbit,正如我之前所说,我使用IDMEF协议规范化了一组日志(snort日志、来自apache的访问日志、来自apache的错误日志),如下所示

下面是原始日志文件snort的示例: bastion snort:[1:2001669:1]前沿Web代理获取请求[分类:潜在的坏流量][优先级:2]:{TCP}220.170.88.36:3047->11.11.79.82:80

目标是如何让类攻击识别是否是攻击{是,否}在使用DTA进行预测之前,我不知道如何找到真正的目标类


Thank's

您的数据集中是否有攻击目标值?Thank's@Running Rabbit,正如我之前所说,我使用IDMEF协议规范了一组日志(snort日志、来自apache的访问日志、来自apache的错误日志),如下所示,在此处输入图像描述,以下是原始日志文件snort示例:bastion snort:[1:2001669:1]前沿Web代理获取请求[分类:潜在坏流量][优先级:2]:{TCP}220.170.88.36:3047->11.11.79.82:80目标是如何获取类攻击以确定是否是攻击{是,否}在使用DTA进行预测之前,我不知道如何找到真正的目标类。谢谢