Database design 创建一个研究数据库

Database design 创建一个研究数据库,database-design,document-storage,Database Design,Document Storage,我想创建一个研究数据库,在那里我可以存储和检索文章(PDF文件)。有什么建议吗 我看过几个关系数据库教程,其中没有一个涉及文档的存储和检索,只有原始数据。要在本地计算机上构建它,请将所有文件放在一个文件夹/目录中,并对其进行唯一命名。使用任何数据库(Postgres、mysql、sqlite、mongo等)存储元数据并按名称引用PDF文件。即使你把它放进数据库,你也无能为力 要在互联网上构建它,也可以使用类似AmazonS3的东西来存储PDF文件。如果你设想其他人与你合作,你可能会决定为它构建一

我想创建一个研究数据库,在那里我可以存储和检索文章(PDF文件)。有什么建议吗


我看过几个关系数据库教程,其中没有一个涉及文档的存储和检索,只有原始数据。

要在本地计算机上构建它,请将所有文件放在一个文件夹/目录中,并对其进行唯一命名。使用任何数据库(Postgres、mysql、sqlite、mongo等)存储元数据并按名称引用PDF文件。即使你把它放进数据库,你也无能为力


要在互联网上构建它,也可以使用类似AmazonS3的东西来存储PDF文件。如果你设想其他人与你合作,你可能会决定为它构建一个Web UI:例如添加或评级文章。

< P>我会考虑使用像弹性搜索、SoR或Lucene之类的东西来代替传统的数据库方法。您可以索引、搜索和访问元数据

以下是通过附件插件的Elasticsearch方式: 以及如何使用示例:

索尔:

和Lucene:

您计划存储多少PDF文档?您预计总共需要多少数据?您可能需要使用NoSQL数据库,如Mongo或MarkLogic。NoSQL将如何帮助存储二进制PDF文档?Kim,这些PDF文件是否有相关的元数据?它是本地数据库还是远程数据库?对于大多数SQL引擎,文档将是一个blob(二进制大对象),只是一个非类型化数据的容器,就像一个文件一样。@Zepplock对于我需要包含的每一篇文章,我需要包括:APA参考信息和带注释的参考书目。我想要一个搜索功能,这样一些元数据也必须附加到文件。它还需要能够容纳100-150件物品。目前还没有数据库。我正试图找出构建它的最佳方式。你说的“即使你把它放入数据库,你也无能为力”是什么意思?使用数据库的原因是你可以对数据库字段进行筛选、排序、分组,甚至计算。使用PDF文件,您无法完成所有这些。谢谢。我就是这么想的。我无法想象它将如何工作。谢谢。这很有帮助。我对数据库了解得越多,就越怀疑它是否能解决我的问题。