Python 如何在没有任何输出数据的情况下预测连续变量?我所拥有的只是输入数据

Python 如何在没有任何输出数据的情况下预测连续变量?我所拥有的只是输入数据,python,machine-learning,predict,continuous,Python,Machine Learning,Predict,Continuous,我正在从事一个网络安全项目,在该项目中,我们必须根据主要是分类变量(也包括两个顺序变量)的现有功能对漏洞进行优先排序 这里的目标是检测最有可能被利用的漏洞,从而确定其优先级。因此,我们必须预测0-10分。我们预测的最高等级(本例中为10级)将是需要立即关注的最关键的漏洞 我们所拥有的只是分类变量(作为输入特性) 再次在此总结问题: 当前输入功能:所有分类变量(带有两个顺序变量) 当前输出功能:不存在 预期输出:预测0-10范围内的分数,10是最严重的漏洞 从来没有遇到过这样的问题。看来回归肯定不

我正在从事一个网络安全项目,在该项目中,我们必须根据主要是分类变量(也包括两个顺序变量)的现有功能对漏洞进行优先排序

这里的目标是检测最有可能被利用的漏洞,从而确定其优先级。因此,我们必须预测0-10分。我们预测的最高等级(本例中为10级)将是需要立即关注的最关键的漏洞

我们所拥有的只是分类变量(作为输入特性)

再次在此总结问题:

当前输入功能:所有分类变量(带有两个顺序变量)

当前输出功能:不存在

预期输出:预测0-10范围内的分数,10是最严重的漏洞


从来没有遇到过这样的问题。看来回归肯定不是答案。你能分享一下你的想法吗?

我可能有点误解,但你似乎没有做出预测所需的信息


我的理解是,您有类别信息,但没有其他关联。对于某些类别,您可能能够根据专家意见硬编码您的预测。例如,预测ping扫描基本上是良性的,只要知道它叫什么。对于任何更具动态性的内容,您将需要比您列出的更多的信息。

如果您不能自己分配分数,机器学习算法将无法做到这一点。它不知道要优化什么


但是,您可以通过使用无监督算法根据分类值对数据进行聚类,然后查看聚类并确定哪些聚类似乎存在最重要的问题,从而获得成功。你可以找到一个关于分类k-均值聚类的讨论。

谢谢你的建议。然而,在对数据进行聚类之后,如果我们需要将数据点的某些等级或层次放在该聚类中,距离质心的距离是否是一个很好的度量标准,或者是否有其他更好的方法来确定优先级