Machine learning 利用weka对传感器数据进行分类_Machine Learning_Classification_Weka_Feature Selection

Machine learning 利用weka对传感器数据进行分类

machine-learning

Machine learning 利用weka对传感器数据进行分类,machine-learning,classification,weka,feature-selection,Machine Learning,Classification,Weka,Feature Selection,我正在研究一个分类问题，它有不同的传感器。每个传感器收集一组数值我认为这是一个分类问题，希望使用weka作为解决这个问题的ML工具。但我不知道如何使用weka来处理输入值？哪个分类器最适合这个问题（特征的一个实例是一组数值）例如，我有三个传感器A、B、C。我可以定义从所有传感器收集的5个数据作为一个实例吗？例如，A的一个实例是{1,2,3,4,5,6,7}，B的一个实例是{3434534213,55,4,7）.C{424,24,24,13,24,5,6} 非常感谢您花时间回顾我的问题。通常第

我正在研究一个分类问题，它有不同的传感器。每个传感器收集一组数值

我认为这是一个分类问题，希望使用weka作为解决这个问题的ML工具。但我不知道如何使用weka来处理输入值？哪个分类器最适合这个问题（特征的一个实例是一组数值）

例如，我有三个传感器A、B、C。我可以定义从所有传感器收集的5个数据作为一个实例吗？例如，A的一个实例是{1,2,3,4,5,6,7}，B的一个实例是{3434534213,55,4,7）.C{424,24,24,13,24,5,6}

非常感谢您花时间回顾我的问题。

通常第一个尝试的分类器是Naive Bayes（您可以在Weka的“Bayes”目录下找到它），因为它速度快，参数少，而且无论何时训练样本小，分类精度都很难达到

随机林（您可以在Weka的“树”目录下找到它）是另一个令人愉快的分类器，因为它处理几乎所有的数据。只需运行它，看看它是否能提供更好的结果。可能只需要将树的数量从默认值10增加到更高的值。因为您有7个属性，所以100棵树就足够了

然后我会尝试k-NN（你可以在Weka的“Lazy”目录下找到它，它被称为“IBk”），因为它通常会对各种数据集的最佳单分类器进行排序。k-NN的唯一问题是它对大数据集（>1GB）的伸缩性很差它需要微调k，邻居的数量。默认情况下，该值设置为1，但随着训练样本数量的增加，通常最好将其设置为2到60之间的某个更高的整数值

最后，对于Naive Bayes和k-nn性能较差的一些数据集，最好使用SVM（在“函数”下，称为“Lib-SVM”）。但是，设置SVM的所有参数以获得竞争性结果可能会很麻烦。因此，我将其留到最后，因为我已经知道了预期的分类精度。如果要分类的类别超过两个，则此分类器可能不是最方便的。

通常尝试的第一个分类器是朴素贝叶斯（您可以在Weka的“Bayes”目录下找到它），因为它速度快，参数少，而且无论何时训练样本小，分类精度都很难达到

最后，对于Naive Bayes和k-nn性能较差的一些数据集，最好使用SVM（在“函数”下，称为“Lib-SVM”）。但是，设置SVM的所有参数以获得有竞争力的结果可能会很麻烦。因此，我将其留到最后，因为我已经知道了预期的分类精度。如果要分类的类别超过两个，则此分类器可能不是最方便的。

您要预测的是什么？您的输入是什么预测？输入是各种传感器数据，都是数值。输出是标称值。谢谢你想预测什么？预测的输入是什么？输入是各种传感器数据，都是数值。输出是标称值。谢谢谢谢。你的答案很有帮助。神经网络呢Works？你说随机林对每种数据都很好，哪种算法不正确？谢谢！谢谢。你的答案非常有用神经网络呢？你说随机林对每种数据都很好，哪种算法不正确？谢谢！