Lucene 露天最优文件夹结构

Lucene 露天最优文件夹结构,lucene,alfresco,directory-structure,Lucene,Alfresco,Directory Structure,我需要在Alfresco上创建文件夹和文档树(4.2 Enterprise Edition和SOLR用于索引)。我的树将有超过200万个文档。我的想法是在“用户主页”空间中创建一个主文件夹“My_REPO”。“MY_REPO”将有5000个子文件夹(每个子文件夹由使用我的应用程序的用户创建)。每个用户都可以使用支持java的WebScript来组织内部的子文件夹,这些WebScript创建节点并上载文档 我的应用程序有两部分:一部分允许在这些文件夹中导航,查看每个节点的文档和自定义属性,以及在所

我需要在Alfresco上创建文件夹和文档树(4.2 Enterprise Edition和SOLR用于索引)。我的树将有超过200万个文档。我的想法是在“用户主页”空间中创建一个主文件夹“My_REPO”。“MY_REPO”将有5000个子文件夹(每个子文件夹由使用我的应用程序的用户创建)。每个用户都可以使用支持java的WebScript来组织内部的子文件夹,这些WebScript创建节点并上载文档

我的应用程序有两部分:一部分允许在这些文件夹中导航,查看每个节点的文档和自定义属性,以及在所有树中使用lucene或FTS进行搜索。另一部分用于上载文档和创建新文件夹

我有一个基本但重要的问题。把这5000个文件夹放在“MY_REPO”里是个坏主意吗?创建更多的文件夹结构是否更好(例如,将这5000个文件夹分成100个一组)?其他文件夹中的文件夹是否有限制或建议的限制?您如何在露天组织您的结构以获得良好的导航和高效的搜索文档?创建一个好的结构是基本的,我找不到关于这个的信息,也找不到关于级别和文件夹数量的建议


另外,文件夹和空间是否相同?在处理大量数据时,创建一个工作区(SpaceStore)并将数据放在“用户主页”目录中是典型的做法吗?

不建议在一个根文件夹下有5000个子文件夹。这会严重影响您的性能。 您需要根据某种逻辑结构划分存储库,这样可以最大限度地减少每个级别的子文件夹数量

基于对您的解决方案有意义的某些标准的逻辑组

文件夹和空间是否相同

是(空格是指在alfresco中显示为文件夹的内容的名称。原因是它们是智能文件夹,具有许多普通文件夹所不具备的高级功能。) 在处理大量数据时,创建一个工作区(SpaceStore)并将数据放在“用户主页”目录中是典型的做法吗

在处理大量数据时,创建一个数据是典型的吗 工作区(SpaceStore)并将数据放在“用户主页”中 目录

不,您应该始终根据一些标准创建文件夹结构,这些标准将在整个存储库中均匀分布内容。例如,基于时间步长、基于用户组等

编辑:
子文件夹编号不应超过1000。子文件夹的数量越少,性能和导航就越好。“用户主页”通常包含特定于用户的空间和内容,这些空间和内容特定于该用户应该去的地方。您可以在主存储库文件夹下创建文件夹树。

谢谢您的回复。你能澄清一些关于这个问题的事情吗?推荐多少子文件夹?我可以考虑不同的文件夹结构,例如,按月或年划分文件夹,但我需要知道一些关于大小的建议。例如,永远不要超过X个子文件夹,X多或少是多少。而且,所有这些文件夹结构可能都在“用户主页”空间中?当我问到如何将数据放入“用户主页”时,我的意思是不直接放入,我的意思是使用一个文件夹树,其中的子文件夹具有“用户主页”,就像主文件夹一样。我解释得不好。“用户之家”永远是结构之父?谢谢!我会听从你的建议。有没有什么地方我可以找到像1000个文件夹限制这样的建议?可能是与其他类似建议的链接。