在Marklogic数据库中摄取文档的最佳方式是什么,这样大小就不会';在数据库中不能增加多少?

在Marklogic数据库中摄取文档的最佳方式是什么,这样大小就不会';在数据库中不能增加多少?,marklogic,Marklogic,在Marklogic中,每当我们摄取任何文档时,文档的大小都会增加1.5倍。我们有什么办法不让尺寸增加吗 谢谢, AK磁盘上文档的大小通常取决于您打开的术语列表索引的数量(以及类型)。一般的经验法则是,启用的索引越多,MarkLogic将使用的磁盘空间就越多 还要注意的是,我们对索引应用哈希,对文档也应用压缩,因此MarkLogic尽量将文档和索引大小保持在最小值。磁盘上文档的大小通常取决于您打开的术语列表索引的数量(以及种类)。一般的经验法则是,启用的索引越多,MarkLogic将使用的磁盘空

在Marklogic中,每当我们摄取任何文档时,文档的大小都会增加1.5倍。我们有什么办法不让尺寸增加吗

谢谢,
AK

磁盘上文档的大小通常取决于您打开的术语列表索引的数量(以及类型)。一般的经验法则是,启用的索引越多,MarkLogic将使用的磁盘空间就越多


还要注意的是,我们对索引应用哈希,对文档也应用压缩,因此MarkLogic尽量将文档和索引大小保持在最小值。

磁盘上文档的大小通常取决于您打开的术语列表索引的数量(以及种类)。一般的经验法则是,启用的索引越多,MarkLogic将使用的磁盘空间就越多


还要注意的是,我们对索引应用了哈希,也对文档应用了压缩,因此MarkLogic正在尽力将文档和索引大小保持在最小值。

最大的影响可能是通用索引,它是全文搜索功能的核心。默认情况下,对于文档数据库,此选项处于启用状态。您可以完全关闭它,但这在文档数据库中非常少见。它通常只对模块、模式和触发器数据库禁用。最大的影响可能是通用索引,它是全文搜索功能背后的核心。默认情况下,对于文档数据库,此选项处于启用状态。您可以完全关闭它,但这在文档数据库中非常少见。它通常只对模块、模式和触发器数据库禁用。有很多因素会影响数据库的总体大小(索引和文档压缩程度)。文件的类型和结构基本相同吗?它们主要是XML、JSON、文本还是二进制文档?您可以禁用一些选项,但这将以牺牲功能为代价。为了加快搜索和检索速度,这通常以牺牲磁盘和/或内存为代价。如果您知道某些特定文档在搜索和查询时不需要索引,则可以将它们存储为
binary()
节点。仅从角度来看,1.5倍是一个不错的选择(小)搜索引擎的比率。有很多因素会影响整个数据库的大小(索引和文档压缩的程度)。文件的类型和结构基本相同吗?它们主要是XML、JSON、文本还是二进制文档?您可以禁用一些选项,但这将以牺牲功能为代价。为了加快搜索和检索速度,这通常是以牺牲磁盘和/或内存为代价的。如果您知道有一些特定文档不需要为搜索和查询编制索引,您可以将它们存储为
binary()
节点。从角度看,1.5倍是搜索引擎的一个相当好(很小)的比率。