Python 在.libsvm格式的数据文件上应用机器学习算法_Python_Machine Learning_Libsvm

Python 在.libsvm格式的数据文件上应用机器学习算法

python machine-learning

Python 在.libsvm格式的数据文件上应用机器学习算法,python,machine-learning,libsvm,Python,Machine Learning,Libsvm,我目前正在处理.libsvm格式的数据集，我无法在这些数据集上使用不同的机器学习算法，如kNN、SVM、Random forest 在.csv格式上应用它们很容易，但该方法在.libsvm文件上不起作用请解释该方法。LIBSVM格式是公开标准化的，可以说比csv更好解析/使用。可以看到基本格式但是你不需要自己去做您可以通过以下内容阅读：将svmlight/libsvm格式的数据集加载到稀疏CSR矩阵中但是要熟悉稀疏矩阵，尽管在使用sklearn时，大多数东西都可以工作，而不必关心密集矩

我目前正在处理.libsvm格式的数据集，我无法在这些数据集上使用不同的机器学习算法，如kNN、SVM、Random forest

在.csv格式上应用它们很容易，但该方法在.libsvm文件上不起作用

请解释该方法。

LIBSVM格式是公开标准化的，可以说比csv更好解析/使用。可以看到基本格式

但是你不需要自己去做

您可以通过以下内容阅读：

将svmlight/libsvm格式的数据集加载到稀疏CSR矩阵中

但是要熟悉稀疏矩阵，尽管在使用sklearn时，大多数东西都可以工作，而不必关心密集矩阵和稀疏矩阵

我不太了解这种格式相对于svmlight格式的背景/演变，但是sklearn的文档说它们是相同的，我可以通过ob能够加载上述函数的经验来支持这一点。

libsvm是一种低级方法，并且有一个简单的估计器。您可以将数据转换为其他格式，然后尝试使用您提到的经典算法（如kNN、SVM、Random forest）在其上构建估计器。@abunickabhi您想说什么？libsvm是一个库，它的简单估计器实际上没有那么简单，它是一个SVM。这是sklearn-doing（内核）支持向量机使用的库。感谢您的关注。我已经使用sklearn成功地加载了数据集，但是在应用机器学习算法时遇到了困难，因为通常的pandas函数无法对其进行操作。