Machine learning 潜在威胁分析分类(IP地址)

Machine learning 潜在威胁分析分类(IP地址),machine-learning,classification,data-science,decision-tree,knn,Machine Learning,Classification,Data Science,Decision Tree,Knn,我想把IP地址分为坏的、中性的或好的。我有3个参数,即 IP地址是否来自DigitalOcean之类的云提供商(只能是真或假)?如果是这样,我们将对其进行处罚 如果IP是已知的VPN/代理(只能是真或假),我们将再次对其进行处罚 IP是否来自一个隐藏的子网(信任分数百分比)?我们惩罚它 起初,我想使用一种信用评分的权重衡量方法,即3个条件各得5分。每个单独的参数都有一个百分比评级,所以如果它是云提供商,我们给它10/100,否则我们可以说给它100/100 问题是,这种方法会导致误报,优化总体权

我想把IP地址分为坏的、中性的或好的。我有3个参数,即

  • IP地址是否来自DigitalOcean之类的云提供商(只能是真或假)?如果是这样,我们将对其进行处罚
  • 如果IP是已知的VPN/代理(只能是真或假),我们将再次对其进行处罚
  • IP是否来自一个隐藏的子网(信任分数百分比)?我们惩罚它
  • 起初,我想使用一种信用评分的权重衡量方法,即3个条件各得5分。每个单独的参数都有一个百分比评级,所以如果它是云提供商,我们给它10/100,否则我们可以说给它100/100

    问题是,这种方法会导致误报,优化总体权重分类范围也是一个问题

    此外,分数范围的差异也是一个问题。例如,在云计算中,提供者可能是真的,也可能是假的,而一个阴暗的域可能有基于现有数据的单独分数

    解决这一问题的更明智的方法是什么?决策树是否足够好,还是我应该选择KNN