Pentaho-Anazyer-Mondrian大型日期集性能

Pentaho-Anazyer-Mondrian大型日期集性能,pentaho,business-intelligence,analyzer,mondrian,large-data,Pentaho,Business Intelligence,Analyzer,Mondrian,Large Data,我在Pentaho面临一些性能问题。它非常慢。 数据集大小约为3500000行 有人有同样的问题吗?我不确定这是因为Pentaho Analyzer还是Mondrian 有没有人体验过Analyzer或Mondrian处理大型数据集的经验?尺寸?演出怎么样?它真的是适合这种数据集的工具吗? 有什么建议吗 谢谢通常analyzer本身不会导致性能问题:相对于DB请求或mondrian聚合时间而言,呈现时间应该非常小。你能补充更多细节吗?至少能看到查询的执行时间,这会很好吗?您可以检查analyze

我在Pentaho面临一些性能问题。它非常慢。 数据集大小约为3500000行

有人有同样的问题吗?我不确定这是因为Pentaho Analyzer还是Mondrian

有没有人体验过Analyzer或Mondrian处理大型数据集的经验?尺寸?演出怎么样?它真的是适合这种数据集的工具吗? 有什么建议吗


谢谢

通常analyzer本身不会导致性能问题:相对于DB请求或mondrian聚合时间而言,呈现时间应该非常小。你能补充更多细节吗?至少能看到查询的执行时间,这会很好吗?您可以检查analyzer日志以获取有关sql执行时间、mondrian执行时间和呈现时间的信息。根据这些时间安排、您的用例和您的环境,可能会采用不同的优化技术。@user4637357:谢谢您的回答。这是sql日志:SEGMENT.LOAD:DONE EXECUTING sql[选择“DIM_ES”,“ES_ID”作为“c0”,“DIM_ES_MAE”,“ES_MA NAME”作为“c1”,SUM(“DIM_ES”,“count_ES”)作为“m0”,从“DIM_ES”,“DIM_ES_MAE”“DIM_ES_ES_MAE”中选择“DIM_ES”,其中“DIM_ES”,“ES_ID”=“DIM_ES_ES_MAE”,“ES_ID”和“DIM_ES”;“DIM_ES”;“em_MA”(此处是一个由100个元素组成的长列表),“DIM_ES_MAE”“ES_MA_NAME”],EXEC+FETCH 58465 ms,829129行,ex=91,CLOSE=90,OPEN=[54]。虽然这是一个简单的查询,但耗时58秒,您有什么建议吗?谢谢您的mondrian服务器和DB服务器位于同一网络中?如果没有,我怀疑您的网络带宽有限:首先您需要传输所有名称(可能是字符串)对于查询的
IN
子句,则需要将名称以及ID和总和作为查询结果从DB传输到mondrian。不过,最好直接在DB中检查查询执行计划,以检查DB端是否存在问题(例如,统计数据不好或缺少索引).我可能错了,但我认为Mondrian以ROLAP的方式向数据库发出查询-尽管它提供了“语义层”的价值,使查询更容易,但它并不总是生成性能最好的查询。如果你想要一种提高性能的技术,它可能不适合你。