什么';在平面数据库(如Excel)或关系数据库中操作数据更快?

什么';在平面数据库(如Excel)或关系数据库中操作数据更快?,excel,relational-database,stata,data-manipulation,Excel,Relational Database,Stata,Data Manipulation,我是一家发布不同公司风险评级数据的公司的入门级优化分析师。我们有大量的数据(到目前为止,我们的历史仅限于Excel中可能的行数) 目前,我们在Stata中使用了许多.do文件来执行所有操作和统计分析(我们运行的最大生产需要9小时,一个insheet需要半分钟)。我正试图说服该公司从使用平面数据库转向使用关系数据库,但一直难以在网上找到关于在Stata中平面数据库还是关系数据库更好的信息。那么——哪一个更好,为什么呢?我假设您回答了自己的问题,强调Excel的局限性使您无法充分利用数据的潜力。Ex

我是一家发布不同公司风险评级数据的公司的入门级优化分析师。我们有大量的数据(到目前为止,我们的历史仅限于Excel中可能的行数)


目前,我们在Stata中使用了许多.do文件来执行所有操作和统计分析(我们运行的最大生产需要9小时,一个insheet需要半分钟)。我正试图说服该公司从使用平面数据库转向使用关系数据库,但一直难以在网上找到关于在Stata中平面数据库还是关系数据库更好的信息。那么——哪一个更好,为什么呢?

我假设您回答了自己的问题,强调Excel的局限性使您无法充分利用数据的潜力。Excel不是一个合适的分析工具或数据仓库解决方案,因此,在分析项目中使用Excel除了为小企业/家庭需求做一些基本计算外,没有任何意义

回答你的问题:

  • 平面文件数据库是一种古老的技术,可以追溯到计算机科学的开端:它们的设计从未满足处理大数据、实时数据流等的现代分析需求

  • 关系数据库

    • 有助于避免数据重复
    • 帮助避免不一致的记录
    • 更改数据格式时更容易

  • 请参阅“我可以在此询问哪些主题”:。您的测试建议了什么?我还没有测试。我对关系数据库了解不多,尤其是与Stata的关系。基本上,当我提到关系数据库时,我的老板总是告诉我不要对它们做任何事情。如果有人能证明我可以自己学习如何做,那么我会的,一旦我有了结果,我会把它带给我的老板。不过,不要无缘无故地浪费时间学习它。您可能想把它带到Statalist,在那里您可能会找到使用
    odbc
    源代码的人。