Performance Power BI中DQ模式的最大数据库大小

Performance Power BI中DQ模式的最大数据库大小,performance,powerbi,Performance,Powerbi,我正在使用一个价值500 GB的数据库。我想可视化不同的列,以使用Power BI研究它们之间的关系。但是,在加载图形时存在性能问题。 我在DQ模式下使用。 每次加载视频都要等待10分钟,这很烦人 有谁能告诉我,使用PowerBI可视化/利用500GB的数据制作仪表板是否是个好主意? 在DQ模式下,我们可以使用的最大数据库限制是多少,以便高效地创建视觉效果?您可能需要查看Power BI中的聚合。基本上,您可以将聚合表导入到Power BI,以满足大多数视觉效果的需要,并求助于直接查询您可能很少

我正在使用一个价值500 GB的数据库。我想可视化不同的列,以使用Power BI研究它们之间的关系。但是,在加载图形时存在性能问题。 我在DQ模式下使用。 每次加载视频都要等待10分钟,这很烦人

有谁能告诉我,使用PowerBI可视化/利用500GB的数据制作仪表板是否是个好主意?
在DQ模式下,我们可以使用的最大数据库限制是多少,以便高效地创建视觉效果?

您可能需要查看Power BI中的聚合。基本上,您可以将聚合表导入到Power BI,以满足大多数视觉效果的需要,并求助于直接查询您可能很少需要的详细信息。正确配置后,聚合将被缓存,命中聚合的视觉效果将利用这一点,而未命中聚合的视觉效果将无缝地查询DQ源

此外,VertiPaq引擎及其列存储在压缩数据方面非常有效。因此,如果进行一些智能建模(去掉不必要的高基数列),您最终可能会得到一个比所有导入的原始数据小得多的模型

您的里程可能会有所不同


至于数据集本身的限制,我相信上传到服务时是1GB/数据集。

DQ没有定义的限制,MS展示了使用PB数据库的演示。在这种情况下,对于数据库上的长时间运行查询,您有一些选项

  • 了解正在运行的查询,并优化索引策略,例如添加覆盖索引

  • 通过使用列存储索引在内存中移动数据源,优化数据源

  • 使用主数据中必要的数据子集创建数据库或表

  • 检查正在使用的对象,删除嵌套逻辑、视图顶部的视图等,以及标量条件等

  • MS的PB示例也使用聚合模式(WB在其回答中提到)来存储数据的子集

    我曾使用直接查询来监视200 GB范围内的数据源,但是这些数据源大多是标准的星型架构数据仓库,或者是定义的报告表,它们都具有相关索引、覆盖索引或列存储索引,以便更高效地检索数据。直接查询模式将减慢速度,因为根据度量、关系和连接开销,它在数据源上拥有的查询数量会减少。另一个可能是页面上的可视内容的数量,因为每个可视内容都是一个查询,并且必须在数据源上运行