Java 具有字符串属性的WEKA决策树

Java 具有字符串属性的WEKA决策树,java,machine-learning,weka,decision-tree,Java,Machine Learning,Weka,Decision Tree,我有一个20的属性集,其中很少有字符串,比如美国各州的代码、订阅计划的名称等等。如何在WEKA中处理字符串属性以构建决策树 我读过关于StringToOrdVector converter的文章,但是这些属性的字符串本身只是一个单词。您可能已经明白了这一点——您必须将这些“字符串属性”(实际的字符串属性在WEKA中是其他的)声明为标称属性,即。,您必须在花括号中声明ARFF头中可以包含的所有值。只需在您的ARFF文件中声明以下模式的属性: @attribute <att_name>

我有一个20的属性集,其中很少有字符串,比如美国各州的代码、订阅计划的名称等等。如何在WEKA中处理字符串属性以构建决策树


我读过关于StringToOrdVector converter的文章,但是这些属性的字符串本身只是一个单词。

您可能已经明白了这一点——您必须将这些“字符串属性”(实际的字符串属性在WEKA中是其他的)声明为标称属性,即。,您必须在花括号中声明ARFF头中可以包含的所有值。

只需在您的ARFF文件中声明以下模式的属性:

@attribute <att_name> string
@属性字符串
要小心,因为
字符串
存储在字符串表的内部,由
他们的地址在那张桌子上。因此,包含相同字符的两个字符串将
具有相同的值


资料来源(书):数据挖掘:实用机器学习工具和技术第3版

来自weka手册的示例:@ATTRIBUTE class{Iris setosa,Iris versicolor,Iris virginica}