Machine learning 利用weka对传感器数据进行分类

Machine learning 利用weka对传感器数据进行分类,machine-learning,classification,weka,feature-selection,Machine Learning,Classification,Weka,Feature Selection,我正在研究一个分类问题,它有不同的传感器。每个传感器收集一组数值 我认为这是一个分类问题,希望使用weka作为解决这个问题的ML工具。但我不知道如何使用weka来处理输入值?哪个分类器最适合这个问题(特征的一个实例是一组数值) 例如,我有三个传感器A、B、C。我可以定义从所有传感器收集的5个数据作为一个实例吗?例如,A的一个实例是{1,2,3,4,5,6,7},B的一个实例是{3434534213,55,4,7).C{424,24,24,13,24,5,6} 非常感谢您花时间回顾我的问题。通常第

我正在研究一个分类问题,它有不同的传感器。每个传感器收集一组数值

我认为这是一个分类问题,希望使用weka作为解决这个问题的ML工具。但我不知道如何使用weka来处理输入值?哪个分类器最适合这个问题(特征的一个实例是一组数值)

例如,我有三个传感器A、B、C。我可以定义从所有传感器收集的5个数据作为一个实例吗?例如,A的一个实例是{1,2,3,4,5,6,7},B的一个实例是{3434534213,55,4,7).C{424,24,24,13,24,5,6}


非常感谢您花时间回顾我的问题。

通常第一个尝试的分类器是Naive Bayes(您可以在Weka的“Bayes”目录下找到它),因为它速度快,参数少,而且无论何时训练样本小,分类精度都很难达到

随机林(您可以在Weka的“树”目录下找到它)是另一个令人愉快的分类器,因为它处理几乎所有的数据。只需运行它,看看它是否能提供更好的结果。可能只需要将树的数量从默认值10增加到更高的值。因为您有7个属性,所以100棵树就足够了

然后我会尝试k-NN(你可以在Weka的“Lazy”目录下找到它,它被称为“IBk”),因为它通常会对各种数据集的最佳单分类器进行排序。k-NN的唯一问题是它对大数据集(>1GB)的伸缩性很差它需要微调k,邻居的数量。默认情况下,该值设置为1,但随着训练样本数量的增加,通常最好将其设置为2到60之间的某个更高的整数值


最后,对于Naive Bayes和k-nn性能较差的一些数据集,最好使用SVM(在“函数”下,称为“Lib-SVM”)。但是,设置SVM的所有参数以获得竞争性结果可能会很麻烦。因此,我将其留到最后,因为我已经知道了预期的分类精度。如果要分类的类别超过两个,则此分类器可能不是最方便的。

通常尝试的第一个分类器是朴素贝叶斯(您可以在Weka的“Bayes”目录下找到它),因为它速度快,参数少,而且无论何时训练样本小,分类精度都很难达到

随机林(您可以在Weka的“树”目录下找到它)是另一个令人愉快的分类器,因为它处理几乎所有的数据。只需运行它,看看它是否能提供更好的结果。可能只需要将树的数量从默认值10增加到更高的值。因为您有7个属性,所以100棵树就足够了

然后我会尝试k-NN(你可以在Weka的“Lazy”目录下找到它,它被称为“IBk”),因为它通常会对各种数据集的最佳单分类器进行排序。k-NN的唯一问题是它对大数据集(>1GB)的伸缩性很差它需要微调k,邻居的数量。默认情况下,该值设置为1,但随着训练样本数量的增加,通常最好将其设置为2到60之间的某个更高的整数值


最后,对于Naive Bayes和k-nn性能较差的一些数据集,最好使用SVM(在“函数”下,称为“Lib-SVM”)。但是,设置SVM的所有参数以获得有竞争力的结果可能会很麻烦。因此,我将其留到最后,因为我已经知道了预期的分类精度。如果要分类的类别超过两个,则此分类器可能不是最方便的。

您要预测的是什么?您的输入是什么预测?输入是各种传感器数据,都是数值。输出是标称值。谢谢你想预测什么?预测的输入是什么?输入是各种传感器数据,都是数值。输出是标称值。谢谢谢谢。你的答案很有帮助。神经网络呢Works?你说随机林对每种数据都很好,哪种算法不正确?谢谢!谢谢。你的答案非常有用神经网络呢?你说随机林对每种数据都很好,哪种算法不正确?谢谢!