Java 对于用户数据,有哪些好的统计可视化框架/库?

Java 对于用户数据,有哪些好的统计可视化框架/库?,java,scala,statistics,visualization,Java,Scala,Statistics,Visualization,我们已经在我们的网站上收集了一段时间的用户数据,现在我们希望以一种可访问的方式呈现数据 我们有一个充满数据的数据库,我们只是在寻找一个框架,我们可以将所有数据转储到其中,并能够将其可视化 一些要求: 必须能够按多个维度进行排序和筛选(例如:按用户、按操作类型、按日期、按元数据) 必须能够将数据视图导出到csv/xml文件中 必须通过web界面显示(无桌面应用程序) 可以与Scala、Java、Python或Ruby一起使用 我们已经研究了使用Vaadin,我们享受我们可以拥有的控制量,但我想

我们已经在我们的网站上收集了一段时间的用户数据,现在我们希望以一种可访问的方式呈现数据

我们有一个充满数据的数据库,我们只是在寻找一个框架,我们可以将所有数据转储到其中,并能够将其可视化

一些要求:

  • 必须能够按多个维度进行排序和筛选(例如:按用户、按操作类型、按日期、按元数据)
  • 必须能够将数据视图导出到csv/xml文件中
  • 必须通过web界面显示(无桌面应用程序)
  • 可以与Scala、Java、Python或Ruby一起使用
我们已经研究了使用Vaadin,我们享受我们可以拥有的控制量,但我想探索其他潜在的解决方案


有没有关于框架的建议可以帮助我们显示我们的统计数据?

我对使用google Visualizations和google提供的java库感到非常高兴。我甚至在Scala中为它编写了一个适配器来与LucidDb一起工作,因为默认情况下提供的DB适配器仅适用于MySQL

尤其是运动图,它是一件非常漂亮的东西

更新

Lucid是处理海量数据的一种很好的方法,可以轻松处理超过1Tb的数据。它是面向列的(如vertica或SybaseIQ),因此您不会因为只选择几列而获取整行数据而产生I/O成本

同样有用的是,Lucid可以通过SQL查询,并且有一个jdbc客户机驱动程序,再加上google Visualization Java库,这是一个理想的匹配,库能够将自己的大部分查询格式转换为SQL,从而最大限度地减少查询后的处理量

我在Scalate框架内运行它,构建所有javascript以动态显示图表。这样,我可以根据页面中的其他控件轻松更改查询参数,并将新数据推送到图表中,而无需重新加载页面。根据你的网站的权重,Lift可能更适合你

整个过程花了我大约一周的时间才完成,不过我以前确实有过使用谷歌图书馆的经验。

我认为这应该符合你的需要。该套件是用java实现的! pentaho数据集成(kettle)应该能够处理所有数据格式(sql db、xml、csv、txt等)


还有一个。值得一试

Infobright也是存储大量数据并将其用于分析的热门选择。它是面向列的,并利用知识网格体系结构快速方便地解决查询。它有开源版本和企业版


Infobright在他们的Infobright.org网站上提供了一个虚拟机以及Pentaho、Jaspersoft和BIRT。如果您想使用这些BI工具,我建议您从那里开始。

看起来很酷,但不知道: