Text 文本分类指针

Text 文本分类指针,text,machine-learning,data-mining,classification,categorization,Text,Machine Learning,Data Mining,Classification,Categorization,我正在尝试开发一个非常简单的程序,使用各种算法对文档进行分类。我的问题是,因为我是一个初学者,所以我找不到好的文章或网站来提供简单的入门教程。我读了不少资料,学到了很多东西,但我读到的每个文档、站点等都使用了不同的技术,它以不同的方式分析问题,提出不同的解决方案等,所以我感到困惑。为了开始实际的实施,您是否可以向我推荐一些好的资源 另外,我正在寻找实际的测试数据,特别是分类的文档,这样我就可以“输入”我的算法。谢谢你的帮助。谢谢。对于Python,请查看。另请参见在基准数据集上运行数十种不同文本

我正在尝试开发一个非常简单的程序,使用各种算法对文档进行分类。我的问题是,因为我是一个初学者,所以我找不到好的文章或网站来提供简单的入门教程。我读了不少资料,学到了很多东西,但我读到的每个文档、站点等都使用了不同的技术,它以不同的方式分析问题,提出不同的解决方案等,所以我感到困惑。为了开始实际的实施,您是否可以向我推荐一些好的资源

另外,我正在寻找实际的测试数据,特别是分类的文档,这样我就可以“输入”我的算法。谢谢你的帮助。谢谢。

对于Python,请查看。另请参见在基准数据集上运行数十种不同文本分类算法(包括朴素贝叶斯和支持向量机)的its。[免责声明:我共同撰写了这些内容。]


对于Weka,这里有一个。

谢谢,我目前正在查看数据集,它非常有用,但由于我使用Java编程,python示例看起来非常混乱。同样对于WEKA,我以前也尝试过,但实际上没有适当的文档。WEKA的教程是一个很好的例子,但内容有限,不多。您知道其他Java方法或指向它的指针吗?感谢您的回复。如果您使用Java编程,那么这可能会对您有很大帮助