Database SQL server可伸缩性问题_Database_Scalability

Database SQL server可伸缩性问题

database

Database SQL server可伸缩性问题,database,scalability,Database,Scalability,我们正在尝试构建一个必须存储数十亿条记录的应用程序。一万亿+ 单个记录将包含文本数据和关于文本文档的元数据 pl帮助我了解存储限制。数据库SQL或oracle可以支持这么多数据吗？或者我必须寻找其他基于文件系统的解决方案？我有什么选择由于中央服务器必须处理来自多个客户端的传入负载，并行插入和搜索将如何扩展？如何在多个数据库或表上分发数据？我对这种规模化环境的数据库细节不太熟悉最初填充数据库时，插入负载将很高，随后随着数据库的增长，搜索负载将增加，插入将减少数据的总大小将超过1000 TB

我们正在尝试构建一个必须存储数十亿条记录的应用程序。一万亿+

单个记录将包含文本数据和关于文本文档的元数据

pl帮助我了解存储限制。数据库SQL或oracle可以支持这么多数据吗？或者我必须寻找其他基于文件系统的解决方案？我有什么选择

由于中央服务器必须处理来自多个客户端的传入负载，并行插入和搜索将如何扩展？如何在多个数据库或表上分发数据？我对这种规模化环境的数据库细节不太熟悉

最初填充数据库时，插入负载将很高，随后随着数据库的增长，搜索负载将增加，插入将减少

数据的总大小将超过1000 TB

谢谢。

根据上的MSDN页面，它可以在一个数据库中容纳524272 TB的数据，尽管它只能容纳每个文件16TB的数据，所以对于1000TB的数据，您可能希望实现。如果文件本身很大，并且将被视为二进制的blob，那么您可能还想看看，它实际上将文件保存在文件系统中，但维护SQL Server的概念，例如事务、备份等

以上所有内容都适用于SQL Server。其他产品（如Oracle）应该提供类似的功能，但我无法列出它们。

根据上的MSDN页面，它可以在单个数据库中容纳524272 TB的容量-尽管它只能容纳每个文件16TB的容量，所以对于1000TB，您应该考虑实现。如果文件本身很大，并且将被视为二进制的blob，那么您可能还想看看，它实际上将文件保存在文件系统中，但维护SQL Server的概念，例如事务、备份等

以上所有内容都适用于SQL Server。其他产品（如Oracle）应该提供类似的功能，但我无法列出它们

一万亿+

单个记录将包含文本数据以及文本文档的元数据

请帮助我了解存储限制

我希望你们在硬件方面有一大笔预算。这和“百万”一样大

一万亿个文档，每个文档的总存储容量为1024字节（当你说文本时，这不太可能是真实的），大约是950 TB的数据大小。存储限制意味着您在这里谈论高端SAN。使用2tb光盘的非冗余设置，即450张光盘。做数学题。增加冗余/raid，您就可以谈论主要的硬件投资。a这假设每个文档只有1kb。如果您平均使用16千克数据，这是。。。7200个2tb光盘

这首先是一个硬件问题。SQL Server的可扩展性不高，而且在单个系统中也无法做到这一点。对于这样的文档存储，通常的方法是集群存储系统（集群或分布式文件系统）加上用于关键字/标记的中央数据库。取决于加载/插入，可能包含分布式搜索的hte数据库的副本

无论将来是什么，存储/备份需求都非常好。这里的Lagre项目，预算很大

IO负载将是另一个问题——硬件方面。您将需要一台大型计算机，并在其中获得大量IO带宽。我在SQL Server上看到8gb的链接过载（由HP eva提供190张光盘），我可以想象您将运行类似的功能。无论价格如何，您都希望硬件在技术上具有尽可能多的ram，除非您将BLOB存储在外部

SQL行压缩可能非常方便。全文搜索将是一个问题

数据的总大小将超过1000 结核病

不，说真的。我想它会更大。1000tb假设文档很小，就像旅行票的XML格式一样