Mysql 查询SQL+HDF5混合体

Mysql 查询SQL+HDF5混合体,mysql,database,orm,hdf5,Mysql,Database,Orm,Hdf5,我正在开发一个混合SQL与mySQL和HDF5数据库解决方案,用于数据分析。我的一些数据非常适合关系数据库,SQL作为一种查询语言非常方便和有效,但是我有大量的数字数据数组和矩阵,包含数千个元素/行/列。因此,我将它们保存在一个HDF5文件中,并根据每个观察中的一些共性来排列组层次结构,这样,如果我将用于派生该层次结构的字段添加到SQL Select查询中,并在关系数据库中添加一个索引,该索引在该特定观察数据集中的位置,我可以快速找到HDF5文件中的数字数据 我用Python、Numpy和h5p

我正在开发一个混合SQL与mySQL和HDF5数据库解决方案,用于数据分析。我的一些数据非常适合关系数据库,SQL作为一种查询语言非常方便和有效,但是我有大量的数字数据数组和矩阵,包含数千个元素/行/列。因此,我将它们保存在一个HDF5文件中,并根据每个观察中的一些共性来排列组层次结构,这样,如果我将用于派生该层次结构的字段添加到SQL Select查询中,并在关系数据库中添加一个索引,该索引在该特定观察数据集中的位置,我可以快速找到HDF5文件中的数字数据


我用Python、Numpy和h5py编写了所有这些。然而,在某一点上,我想让整个过程更加用户友好,甚至可以在Web服务器上查询和可视化。我最初的猜测是从Django或SQLAlchemy这样的ORM开始,然后添加一些实际的脚本来处理HDf5。有没有人有过这种混合方法的经验,特别是在这个级别?对新手有什么建议吗?

使用H5Oget_信息检索文件中的HDF5数据集地址并将其存储在数据库记录中,您可能会受益匪浅。然后,数据集地址可以与H5Oopen_by_addr一起使用,直接打开HDF5数据集,而无需遍历HDF5文件中的组层次结构

见: 和

您可能对这项工作感兴趣:


顺便说一句,在这项工作之后,开发了更多的功能,包括索引、采样和结构分组。

我知道这篇文章。但是这个软件在什么地方可用吗?它还不是开源的,但是如果你需要的话,我可以给你发源代码。遗憾的是我的名声还不允许投票,但是非常感谢你的文章,它非常有趣!