Machine learning 给定一个与像素值对应的整数文本文件,实现无监督学习算法的最有效方法是什么?

Machine learning 给定一个与像素值对应的整数文本文件,实现无监督学习算法的最有效方法是什么?,machine-learning,Machine Learning,很抱歉,标题有点模糊,但我想不出更简洁的方式来陈述我的问题 我有一个大约1500行256列的.txt文件,取自UCI的机器学习库。每行是256个二进制值的向量,表示手写数字图像的16x16缩放版本,即0到9。要获得完整的解释,您可以阅读他们的完整描述 因为我在可视化我正在使用的东西时遇到困难,所以我编写了一个简短的Java程序来从文本文件中绘制每个图像。其中一个例子,似乎是“5”;如果像素为1,程序只需向下移动每一行并为正方形着色 我想分析这个文本文件来教机器学习系统如何识别不同的数字。我正在修

很抱歉,标题有点模糊,但我想不出更简洁的方式来陈述我的问题

我有一个大约1500行256列的.txt文件,取自UCI的机器学习库。每行是256个二进制值的向量,表示手写数字图像的16x16缩放版本,即0到9。要获得完整的解释,您可以阅读他们的完整描述

因为我在可视化我正在使用的东西时遇到困难,所以我编写了一个简短的Java程序来从文本文件中绘制每个图像。其中一个例子,似乎是“5”;如果像素为1,程序只需向下移动每一行并为正方形着色

我想分析这个文本文件来教机器学习系统如何识别不同的数字。我正在修一门大学课程,在那里我们学习许多不同的机器学习技术,但我不确定哪一种最适合在这里应用。我考虑过无监督的Hebbian网络、隐马尔可夫模型、k-均值聚类和其他一些方法,但以我有限的知识,我真的不知道哪种方法是解决这个问题的“最佳”(即,最容易实现的方法和错误率最低的方法的组合)


我可以访问MatLab,还下载了很多开源的机器学习库,如NeuroPH、gCLUTO和其他库,但我不确定从哪里开始。什么是分析这一特定数据集的好技术,如果可能的话,有人能推荐这个系统的特定库或实现吗?谢谢大家!

您的数据有标签,因此为什么要考虑无监督技术?如果没有标签,则使用无监督方法。在学习实际有标签的东西时,受监督总是更好(无监督仍然可以用来帮助受监督的同行,但不是相反)。对不起,我的无知,我对这门学科是新手,但我该如何实现这一点?我认为监督学习的整个要点是,在给定输入的情况下,指定要查看的输出——即,如果您看到某个向量{v1..v256},请将其解释为数字“2”。但是,如果数据文件的全部要点是图像不完全相同,那么我如何编写代码来告诉网络在给定一些输入的情况下选择一些输出?我是否最好尝试通过相似性(k-means/Veroni-tesselation)简单地对行进行聚类,然后自己分配标签?是的,在这种设置中您需要标签,并且您的数据已清楚地标记。当然,你可以试着在没有监督的情况下找到一些小组,只是为了练习。如果是这样的话,那么就没有最好的方法了。有很多解决方案,特别是对于这样简单的数据。试着从你理解的任何方法开始,分析发生了什么,如果不满意,试着下一步。没有最好的方法