Python 在.libsvm格式的数据文件上应用机器学习算法
我目前正在处理.libsvm格式的数据集,我无法在这些数据集上使用不同的机器学习算法,如kNN、SVM、Random forest 在.csv格式上应用它们很容易,但该方法在.libsvm文件上不起作用Python 在.libsvm格式的数据文件上应用机器学习算法,python,machine-learning,libsvm,Python,Machine Learning,Libsvm,我目前正在处理.libsvm格式的数据集,我无法在这些数据集上使用不同的机器学习算法,如kNN、SVM、Random forest 在.csv格式上应用它们很容易,但该方法在.libsvm文件上不起作用 请解释该方法。LIBSVM格式是公开标准化的,可以说比csv更好解析/使用。可以看到基本格式 但是你不需要自己去做 您可以通过以下内容阅读: 将svmlight/libsvm格式的数据集加载到稀疏CSR矩阵中 但是要熟悉稀疏矩阵,尽管在使用sklearn时,大多数东西都可以工作,而不必关心密集矩
请解释该方法。LIBSVM格式是公开标准化的,可以说比csv更好解析/使用。可以看到基本格式 但是你不需要自己去做 您可以通过以下内容阅读: 将svmlight/libsvm格式的数据集加载到稀疏CSR矩阵中 但是要熟悉稀疏矩阵,尽管在使用sklearn时,大多数东西都可以工作,而不必关心密集矩阵和稀疏矩阵
我不太了解这种格式相对于svmlight格式的背景/演变,但是sklearn的文档说它们是相同的,我可以通过ob能够加载上述函数的经验来支持这一点。libsvm是一种低级方法,并且有一个简单的估计器。您可以将数据转换为其他格式,然后尝试使用您提到的经典算法(如kNN、SVM、Random forest)在其上构建估计器。@abunickabhi您想说什么?libsvm是一个库,它的简单估计器实际上没有那么简单,它是一个SVM。这是sklearn-doing(内核)支持向量机使用的库。感谢您的关注。我已经使用sklearn成功地加载了数据集,但是在应用机器学习算法时遇到了困难,因为通常的pandas函数无法对其进行操作。