Java 如何以编程方式挖掘推特sql转储。
我有一个推特mysql转储。 我想在此转储上构建一个分类器。 我想知道是否有我可以使用的包,以及我应该使用什么类型的分类器。Java 如何以编程方式挖掘推特sql转储。,java,data-mining,tweets,Java,Data Mining,Tweets,我有一个推特mysql转储。 我想在此转储上构建一个分类器。 我想知道是否有我可以使用的包,以及我应该使用什么类型的分类器。 我想用java构建这个分类器 我建议您使用WEKA:--WEKA包含大量数据挖掘算法和实用程序 它有一个GUI,您可以在其中试验数据上的分类器和过滤器的各种配置和组合,当您构建了一个好的模型时,您可以在java程序中嵌入WEKA(它也是java),并将其与预构建的模型一起使用以预测类,或者使用它来不断优化模型。或者在使用WEKA进行实验之后,您可以在自己的应用程序中实现生
我想用java构建这个分类器 我建议您使用WEKA:--WEKA包含大量数据挖掘算法和实用程序 它有一个GUI,您可以在其中试验数据上的分类器和过滤器的各种配置和组合,当您构建了一个好的模型时,您可以在java程序中嵌入WEKA(它也是java),并将其与预构建的模型一起使用以预测类,或者使用它来不断优化模型。或者在使用WEKA进行实验之后,您可以在自己的应用程序中实现生成的决策树或其他任何东西,这样就不必包含WEKA 您可能希望使用tweet的“单词袋”表示,并使用诸如多层感知器、NaiveBayes或J48之类的分类器——所有这些都可以在WEKA中进行实验 查看此页面:--页面底部有一个文本分类示例 干杯, 这个链接有一些包。(与机器学习相关) 这是为那些可能有兴趣做同样事情的人准备的。 因此,我回答了自己的问题。
享受。什么是推特?你所说的“要使用的分类器类型”是什么意思?我们从推特网站上得到的推特。我需要挖掘那些。我们在sql转储中获取它们。我计划使用朴素贝叶斯分类器。主要是基于文本分析。(但如果有任何不同的建议)。最后是使用哪种软件包。我尝试了weka,但在浩瀚的空间中迷失了方向,也没有给出多少文档。是否还有其他类似的数据挖掘库?您为此使用的任何文档。现有的文件是不够的。ThanxI编辑了上面的链接,链接到一个文本分类示例,希望对您有所帮助。这也会有所帮助。虽然他们不直接回答这个问题,但他们仍然可以作为指导