Text 文本挖掘库还是语言库?

Text 文本挖掘库还是语言库?,text,data-mining,text-mining,Text,Data Mining,Text Mining,我有一大堆从我自己的论坛上收集的数据,我想做一些文本挖掘或使用一些语言库来提取有用的信息 任何文本挖掘,任何语言的数据挖掘库都可以 谢谢。是为文本挖掘而设计的java库。一旦您对文本数据进行了预处理,像这样的通用数据挖掘工具也可以满足您的任务 如果您可以访问SPSS或SAS,他们的产品应该更易于使用 是为文本挖掘而设计的java库。一旦您对文本数据进行了预处理,像这样的通用数据挖掘工具也可以满足您的任务 如果您可以访问SPSS或SAS,他们的产品应该更易于使用 您可能想看看Python(自然语言

我有一大堆从我自己的论坛上收集的数据,我想做一些文本挖掘或使用一些语言库来提取有用的信息

任何文本挖掘,任何语言的数据挖掘库都可以

谢谢。

是为文本挖掘而设计的java库。一旦您对文本数据进行了预处理,像这样的通用数据挖掘工具也可以满足您的任务

如果您可以访问SPSS或SAS,他们的产品应该更易于使用

是为文本挖掘而设计的java库。一旦您对文本数据进行了预处理,像这样的通用数据挖掘工具也可以满足您的任务


如果您可以访问SPSS或SAS,他们的产品应该更易于使用

您可能想看看Python(自然语言工具包):它是专门为这类东西设计的


还有一种方法可以让您入门。

您可能想看看Python(自然语言工具包):它是专门为这类事情设计的

还有一种方法,你只能从中开始。

我建议你这样做。它有大量的文本挖掘包:。特别是查看
tm
软件包。以下是一些相关链接:

  • 《统计计算杂志》上关于该软件包的论文:。本文包括一个很好的R-devel分析示例 邮件列表()2006年的新闻组帖子
  • 套餐主页:
  • 请看介绍性小插曲:
另一个有用的软件包示例是。

我建议您使用。它有大量的文本挖掘包:。特别是查看
tm
软件包。以下是一些相关链接:

  • 《统计计算杂志》上关于该软件包的论文:。本文包括一个很好的R-devel分析示例 邮件列表()2006年的新闻组帖子
  • 套餐主页:
  • 请看介绍性小插曲:

另一个有用的软件包示例是。

试试GATE,它有GUI,当然您可以使用java api获得更多功能:

您还可以使用Weka处理文本和进行文本挖掘,请看以下有用的课程:

试试GATE,它有GUI,当然,您可以使用java api获得更多功能:

您还可以使用Weka处理文本和进行文本挖掘,请看以下有用的课程:

斯坦福核心nlp适用于英文文本,并具有命名实体识别等功能。看看:

Ehsan已经推荐的GATE也不错,但如果您需要编写自己的组件,它可能有点复杂。对于大型的东西,这是伟大的


UIMA类似于GATE,但不易使用,因为它不像GATE那样具有广泛的GUI功能。()

斯坦福核心nlp适用于英文文本,并具有命名实体识别等功能。看看:

Ehsan已经推荐的GATE也不错,但如果您需要编写自己的组件,它可能有点复杂。对于大型的东西,这是伟大的


UIMA类似于GATE,但不易使用,因为它不像GATE那样具有广泛的GUI功能。()

我建议使用以下Python库:

  • nltk
  • keras
  • tensorflow

  • 注意:在进行任何文本分析之前,应根据您的需求清理数据

    我建议使用以下Python库:

  • nltk
  • keras
  • tensorflow

  • 注意:在进行任何文本分析之前,您应该根据您的需求清理数据

    您希望挖掘什么?有时,定义问题比解决方案更难。你想挖掘什么?有时,定义问题比解决方案更难。一些weka讲座似乎破坏了下载链接。一些weka讲座似乎破坏了下载链接。