Machine learning 如何识别数据集上的可变目标，以便使用机器学习进行预测_Machine Learning_Decision Tree

Machine learning 如何识别数据集上的可变目标，以便使用机器学习进行预测

machine-learning

Machine learning 如何识别数据集上的可变目标，以便使用机器学习进行预测,machine-learning,decision-tree,Machine Learning,Decision Tree,我正在做一个项目，使用决策树从日志中预测攻击问题是在规范化日志文件之后，我不知道如何识别输出类，以便将从决策树获得的结果与实际结果进行比较说实话，我不知道如何识别真正的班级我是否需要关联以识别类谢谢你的帮助你的问题不清楚。如果您可以共享您想要的日志或结果数据集，那就太好了但是，您可以检查是否遵循分类或回归。它们之间的主要区别在于回归中的输出变量是数值的（或连续的），而分类中的输出变量是分类的（或离散的）因此，请检查完整描述上述内容的列（分类或回归）thank's@Running Ra

我正在做一个项目，使用决策树从日志中预测攻击

问题是在规范化日志文件之后，我不知道如何识别输出类，以便将从决策树获得的结果与实际结果进行比较

说实话，我不知道如何识别真正的班级

我是否需要关联以识别类

谢谢你的帮助

你的问题不清楚。如果您可以共享您想要的日志或结果数据集，那就太好了

但是，您可以检查是否遵循分类或回归。它们之间的主要区别在于回归中的输出变量是数值的（或连续的），而分类中的输出变量是分类的（或离散的）

因此，请检查完整描述上述内容的列（分类或回归）

thank's@Running Rabbit，正如我之前所说，我使用IDMEF协议规范化了一组日志（snort日志、来自apache的访问日志、来自apache的错误日志），如下所示

下面是原始日志文件snort的示例： bastion snort:[1:2001669:1]前沿Web代理获取请求[分类：潜在的坏流量][优先级：2]：{TCP}220.170.88.36:3047->11.11.79.82:80

目标是如何让类攻击识别是否是攻击{是，否}在使用DTA进行预测之前，我不知道如何找到真正的目标类

Thank's

您的数据集中是否有攻击目标值？Thank's@Running Rabbit，正如我之前所说，我使用IDMEF协议规范了一组日志（snort日志、来自apache的访问日志、来自apache的错误日志），如下所示，在此处输入图像描述，以下是原始日志文件snort示例：bastion snort:[1:2001669:1]前沿Web代理获取请求[分类：潜在坏流量][优先级：2]：{TCP}220.170.88.36:3047->11.11.79.82:80目标是如何获取类攻击以确定是否是攻击{是，否}在使用DTA进行预测之前，我不知道如何找到真正的目标类。谢谢