Machine learning 从回归模型求属性值组合_Machine Learning_Regression_Decision Tree

Machine learning 从回归模型求属性值组合

machine-learning

Machine learning 从回归模型求属性值组合,machine-learning,regression,decision-tree,Machine Learning,Regression,Decision Tree,我有一个回归相关的问题，但我不确定如何继续。考虑下面的数据集，如 a >代码> b ， c>代码>和 d>代码>作为属性（特征）和决策变量 DEC/每行： A B C D Dec a1 b1 c1 d1 Y a1 b2 c2 d2 N a2 b2 c3 d2 N a2 b1 c3 d1 N a1 b3 c2 d3 Y a1 b1 c1 d2 N a1 b1 c4 d1 Y 考虑到这些数据，

我有一个回归相关的问题，但我不确定如何继续。考虑下面的数据集，如<代码> a <代码> >代码> b <代码>，<代码> c>代码>和<代码> d>代码>作为属性（特征）和决策变量<代码> DEC/<代码>每行：

  A   B   C   D   Dec
  a1  b1  c1  d1  Y
  a1  b2  c2  d2  N
  a2  b2  c3  d2  N
  a2  b1  c3  d1  N
  a1  b3  c2  d3  Y
  a1  b1  c1  d2  N
  a1  b1  c4  d1  Y

考虑到这些数据，我想找出

Dec

计算结果为

的最简洁的规则。例如，

A=a1和B=b1和D=d1=>Y

我更愿意为这些规则的精度指定阈值，以便根据我的要求过滤掉它们。例如，我希望看到所有提供至少90%精度的规则。这可以让我更好地压缩规则。上述规则提供100%的精度，而

B=b1和D=d1=>Y

具有66%的精度（第4行出错）

隐约地，我可以看出，这类似于构建决策树并找出以

结尾的路径。如果我理解正确，构建回归模型将为我提供最重要的属性，但我需要属性的实际值组合，这将导致

属性值是多值的，但这不是硬约束。我甚至可以假设它们是布尔值

现有工具中是否有可以帮助我的库，如

Weka

或

关于

我不认为这是一个回归问题。这似乎是一个分类问题，您试图对Y或N进行分类。您可以构建像Adaboost这样的集成学习器，看看决策在不同的树之间如何变化，或者您可以做一些类似弹性网络逻辑回归的事情，看看最终的权重是什么

谢谢@aplassard。我提到回归只是因为我对找出最重要的特征值感兴趣。Adaboost还可以，但我想知道解决方案的核心。有什么分类框架可以让我知道最终学习到的权重吗？大多数分类技术都有一些识别重要特征的方法。logistic回归中包含的百分比方差或随机森林中的树权重可能有用。Scikit学习（python）使这变得非常简单。谢谢@aplassard。我提到回归只是因为我对找出最重要的特征值感兴趣。Adaboost还可以，但我想知道解决方案的核心。有什么分类框架可以让我知道最终学习到的权重吗？大多数分类技术都有一些识别重要特征的方法。logistic回归中包含的百分比方差或随机森林中的树权重可能有用。Scikit学习（python）使这变得非常简单。谢谢@aplassard。我提到回归只是因为我对找出最重要的特征值感兴趣。Adaboost还可以，但我想知道解决方案的核心。有什么分类框架可以让我知道最终学习到的权重吗？大多数分类技术都有一些识别重要特征的方法。logistic回归中包含的百分比方差或随机森林中的树权重可能有用。Scikit学习（python）使这变得非常简单。谢谢@aplassard。我提到回归只是因为我对找出最重要的特征值感兴趣。Adaboost还可以，但我想知道解决方案的核心。有什么分类框架可以让我知道最终学习到的权重吗？大多数分类技术都有一些识别重要特征的方法。logistic回归中包含的百分比方差或随机森林中的树权重可能有用。Scikit学习（python）使这变得非常简单。