Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/database/8.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Database 如何使用数据库存储大型日常文本源?_Database_Text_Store - Fatal编程技术网

Database 如何使用数据库存储大型日常文本源?

Database 如何使用数据库存储大型日常文本源?,database,text,store,Database,Text,Store,我正在做一项基于文本处理和挖掘的研究。原则很简单,我们收集特定日期内的所有帖子,例如“2011年1月1日”。我们不在乎哪个客户发布这些内容,我们只关注他发布内容的时间。例如,在日期“2011年1月1日”,这里有五位客户在我们的论坛上发表了一些关于产品的想法,我们删除了关于客户的信息,并将他们的帖子内容合并在一起 然而,我们有一个大型论坛,所以我们可能有成千上万的人每天都在活跃地发布长或短的帖子。如果我们把它们结合起来。一天要排一万甚至十万行 我们想使用一些数据库,比如MySQL来构建一个表来保存

我正在做一项基于文本处理和挖掘的研究。原则很简单,我们收集特定日期内的所有帖子,例如“2011年1月1日”。我们不在乎哪个客户发布这些内容,我们只关注他发布内容的时间。例如,在日期“2011年1月1日”,这里有五位客户在我们的论坛上发表了一些关于产品的想法,我们删除了关于客户的信息,并将他们的帖子内容合并在一起

然而,我们有一个大型论坛,所以我们可能有成千上万的人每天都在活跃地发布长或短的帖子。如果我们把它们结合起来。一天要排一万甚至十万行

我们想使用一些数据库,比如MySQL来构建一个表来保存,然后再进行数据挖掘。我们对表格的第一个想法非常简单:

表格

  Date              combinedPostContents
  2011Jan01       "blablalbla everything from clients, lot of contents"
这简单合理吗?或者我们应该使用本地文本文件来保存内容,并按收集日期命名文本文件?哪一个更好


提前谢谢你,大师!!:)

数据挖掘文本信息以获取客户对产品的想法将非常困难。你肯定会想使用数据库,你真的应该为他们正在审查的产品做一些评级系统。

为什么给我a-1?这个问题不重要吗?非常感谢。我的问题是,如果一天中的内容约为十万字,那么将其保存在数据库的一列中是否合理?一列或一千列不会简化文本搜索问题,因此可以肯定,在Microsoft SQL Server中,NVARCHAR(MAX)应该可以正常工作。