Warning: file_get_contents(/data/phpspider/zhask/data//catemap/6/mongodb/12.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Mongodb 非结构化文本的数据挖掘_Mongodb_Data Mining - Fatal编程技术网

Mongodb 非结构化文本的数据挖掘

Mongodb 非结构化文本的数据挖掘,mongodb,data-mining,Mongodb,Data Mining,我现在正在一个学术项目中工作,我想使用数据挖掘技术进行市场细分 我想存储文本信息(通常是大量文本),比如tweet、新闻提要等,所以它们是不同的数据源(它们有不同的结构) 有两个问题: 获取所有这些新闻文章、帖子等的最佳方式是什么,这样我才能最终获得足够的文本数据,从而有可能对其进行处理并从中得出好的结论?或者我可以使用什么其他类型的非结构化数据 在哪里存储所有非结构化文本,以便以后访问它并应用所有这些文本挖掘技术?MongoDB呢 非常感谢你 请看以下内容:

我现在正在一个学术项目中工作,我想使用数据挖掘技术进行市场细分

我想存储文本信息(通常是大量文本),比如tweet、新闻提要等,所以它们是不同的数据源(它们有不同的结构)

有两个问题:

  • 获取所有这些新闻文章、帖子等的最佳方式是什么,这样我才能最终获得足够的文本数据,从而有可能对其进行处理并从中得出好的结论?或者我可以使用什么其他类型的非结构化数据

  • 在哪里存储所有非结构化文本,以便以后访问它并应用所有这些文本挖掘技术?MongoDB呢


  • 非常感谢你

    请看以下内容: