Machine learning 从回归模型求属性值组合

Machine learning 从回归模型求属性值组合,machine-learning,regression,decision-tree,Machine Learning,Regression,Decision Tree,我有一个回归相关的问题,但我不确定如何继续。考虑下面的数据集,如 a >代码> b , c>代码>和 d>代码>作为属性(特征)和决策变量 DEC/每行: A B C D Dec a1 b1 c1 d1 Y a1 b2 c2 d2 N a2 b2 c3 d2 N a2 b1 c3 d1 N a1 b3 c2 d3 Y a1 b1 c1 d2 N a1 b1 c4 d1 Y 考虑到这些数据,

我有一个回归相关的问题,但我不确定如何继续。考虑下面的数据集,如<代码> a <代码> >代码> b <代码>,<代码> c>代码>和<代码> d>代码>作为属性(特征)和决策变量<代码> DEC/<代码>每行:

  A   B   C   D   Dec
  a1  b1  c1  d1  Y
  a1  b2  c2  d2  N
  a2  b2  c3  d2  N
  a2  b1  c3  d1  N
  a1  b3  c2  d3  Y
  a1  b1  c1  d2  N
  a1  b1  c4  d1  Y
考虑到这些数据,我想找出
Dec
计算结果为
Y
的最简洁的规则。 例如,
A=a1和B=b1和D=d1=>Y

我更愿意为这些规则的精度指定阈值,以便根据我的要求过滤掉它们。例如,我希望看到所有提供至少90%精度的规则。这可以让我更好地压缩规则。上述规则提供100%的精度,而
B=b1和D=d1=>Y
具有66%的精度(第4行出错)

隐约地,我可以看出,这类似于构建决策树并找出以
Y
结尾的路径。如果我理解正确,构建回归模型将为我提供最重要的属性,但我需要属性的实际值组合,这将导致
Y

属性值是多值的,但这不是硬约束。我甚至可以假设它们是布尔值

现有工具中是否有可以帮助我的库,如
Weka
R


关于

我不认为这是一个回归问题。这似乎是一个分类问题,您试图对Y或N进行分类。您可以构建像Adaboost这样的集成学习器,看看决策在不同的树之间如何变化,或者您可以做一些类似弹性网络逻辑回归的事情,看看最终的权重是什么

我不认为这是一个回归问题。这似乎是一个分类问题,您试图对Y或N进行分类。您可以构建像Adaboost这样的集成学习器,看看决策在不同的树之间如何变化,或者您可以做一些类似弹性网络逻辑回归的事情,看看最终的权重是什么

我不认为这是一个回归问题。这似乎是一个分类问题,您试图对Y或N进行分类。您可以构建像Adaboost这样的集成学习器,看看决策在不同的树之间如何变化,或者您可以做一些类似弹性网络逻辑回归的事情,看看最终的权重是什么

我不认为这是一个回归问题。这似乎是一个分类问题,您试图对Y或N进行分类。您可以构建像Adaboost这样的集成学习器,看看决策在不同的树之间如何变化,或者您可以做一些类似弹性网络逻辑回归的事情,看看最终的权重是什么

谢谢@aplassard。我提到回归只是因为我对找出最重要的特征值感兴趣。Adaboost还可以,但我想知道解决方案的核心。有什么分类框架可以让我知道最终学习到的权重吗?大多数分类技术都有一些识别重要特征的方法。logistic回归中包含的百分比方差或随机森林中的树权重可能有用。Scikit学习(python)使这变得非常简单。谢谢@aplassard。我提到回归只是因为我对找出最重要的特征值感兴趣。Adaboost还可以,但我想知道解决方案的核心。有什么分类框架可以让我知道最终学习到的权重吗?大多数分类技术都有一些识别重要特征的方法。logistic回归中包含的百分比方差或随机森林中的树权重可能有用。Scikit学习(python)使这变得非常简单。谢谢@aplassard。我提到回归只是因为我对找出最重要的特征值感兴趣。Adaboost还可以,但我想知道解决方案的核心。有什么分类框架可以让我知道最终学习到的权重吗?大多数分类技术都有一些识别重要特征的方法。logistic回归中包含的百分比方差或随机森林中的树权重可能有用。Scikit学习(python)使这变得非常简单。谢谢@aplassard。我提到回归只是因为我对找出最重要的特征值感兴趣。Adaboost还可以,但我想知道解决方案的核心。有什么分类框架可以让我知道最终学习到的权重吗?大多数分类技术都有一些识别重要特征的方法。logistic回归中包含的百分比方差或随机森林中的树权重可能有用。Scikit学习(python)使这变得非常简单。