Database 构建文本内容网站的正确方法是什么?

Database 构建文本内容网站的正确方法是什么?,database,text,lucene,full-text-search,text-based,Database,Text,Lucene,Full Text Search,Text Based,我正在建立一个网站,将有文章,政策和法律和文字资料。我将所有数据(在某些情况下,文章超过8000个字符)存储在MSSql 2008数据库中。我读过一些文章,他们说文本数据不应该存储在数据库中。它们应该存放在哪里?在.txt文件中还是什么?我还想搜索数据。如果它们存储在DB中,我可以使用存储过程等。如果存储在文档中,我需要使用Lucene之类的工具。我说得对吗?对于这个项目,我使用DB的方法是错误的吗?请告诉我。无论您如何看待该项目,您都将为此项目使用某种描述的数据库,无论它是: 1) 老式的平面

我正在建立一个网站,将有文章,政策和法律和文字资料。我将所有数据(在某些情况下,文章超过8000个字符)存储在MSSql 2008数据库中。我读过一些文章,他们说文本数据不应该存储在数据库中。它们应该存放在哪里?在.txt文件中还是什么?我还想搜索数据。如果它们存储在DB中,我可以使用存储过程等。如果存储在文档中,我需要使用Lucene之类的工具。我说得对吗?对于这个项目,我使用DB的方法是错误的吗?请告诉我。

无论您如何看待该项目,您都将为此项目使用某种描述的数据库,无论它是: 1) 老式的平面文件数据库(txt文档,不建议用于大型项目imho) 2) 传统的文本存储数据库 3) 文档数据库

是否使用文本数据库或文档数据库取决于您拥有或可能获得(或协助)的技能/知识。在我看来,你更喜欢文本数据库,在我看来,这没有什么错——最糟糕的情况是,如果最终真的需要长期使用文档,而不是直接的文本存储,那么你应该能够从文本数据库自动生成文档——我怀疑是这样的反之则要复杂得多(将大量专有文档转换为文本以便存储和插入)。从文本数据库生成纯文本文件非常简单,大多数供应商文档格式都支持导入纯文本文档以进行后续格式化

对于这样一个大型项目,您确实需要花一些时间来考虑您的文档可能用于什么目的、由谁使用,以及哪些方法最适合它们。如果您正在为大量使用MS Word和想要下载数据的人提供数据库,您可能需要考虑使用文档DB。如果它只是您想要提供的信息(和基于Web的工具),您需要考虑如何操作自己的数据。


这显然是所有的观点,但我最后的建议是,如果你走上文本路线(痛苦的经历),请确保从一开始就使用utf-8文本。

[需要引用]。文本数据应该存储在数据库中,这就是它们的用途。您确定没有读到“图像数据不应存储在数据库中”吗?(甚至这也是有争议的)在本文中,请参阅您错误引用的“为什么不使用SQL Server?”一节。它说“不要使用SQL Server存储和搜索大量文本”(我的重点)。8000个字符(从数据库的角度来看)不是一个很大的文本量,而不是2012年。在问题开始显现之前,您需要将所有文章至少放大一百倍。对于您描述的这样的站点,MSSQL已经足够了。还要注意的是,本文是关于全文搜索的,而不仅仅是存储和检索。由于所有数据都存储在数据库中(在不同的表中),我应该如何从中搜索单词?我可以使用lucene(或其他工具)搜索数据库,还是最好使用好的旧存储过程?还有一件事,我听说如果你将数据存储在数据库中,搜索引擎优化就会变得很困难,因为谷歌蜘蛛无法爬过它们。是这样吗?有什么解决办法吗?我需要全文搜索,不是吗?