Math 程序员的统计工具

Math 程序员的统计工具,math,statistics,Math,Statistics,我正在评估购买统计工具的情况。这将部分由非编程用户(做临床研究)使用,部分由程序员使用,因此我试图在可用性和自动化之间找到一个很好的折衷方案。当然,成本是一个问题,但如果我能建立一个可靠的案例,我们可能会购买一个商业套餐,所以我们不完全局限于免费选择 到目前为止,我们的选择是: Statistica(一些非程序员已经知道) Matlab统计工具箱(程序员已经使用Matlab) R语言(非程序员需要UI) 在Excel中输入一些东西(不好玩,但非程序员现在就是这么做的) 外面还有什么?行业标

我正在评估购买统计工具的情况。这将部分由非编程用户(做临床研究)使用,部分由程序员使用,因此我试图在可用性和自动化之间找到一个很好的折衷方案。当然,成本是一个问题,但如果我能建立一个可靠的案例,我们可能会购买一个商业套餐,所以我们不完全局限于免费选择

到目前为止,我们的选择是:

  • Statistica(一些非程序员已经知道)
  • Matlab统计工具箱(程序员已经使用Matlab)
  • R语言(非程序员需要UI)
  • 在Excel中输入一些东西(不好玩,但非程序员现在就是这么做的)
外面还有什么?行业标准是什么?我应该寻找什么样的特色?你会推荐什么,为什么

理想情况下,我们希望有一个可以在Linux和Windows机器上运行的工具

(我从事医学成像工作,所以我们同时从事生物统计学和软件工程统计学)

我会看看


您可以获得强大的编程环境(基于Eclipse平台的S-Plus工作台)、面向非程序员的直观GUI和广泛的用户社区(包括基于原始S的R用户)。

我个人推荐R。我听说生物信息学家和心理学家都在使用它。但我不知道你的领域是什么,所以这可能是一个糟糕的选择。它相当容易使用和学习。

并且往往是临床研究中最常用的软件包。对于没有技术头脑的人来说,两者都很容易学习和使用,但通常都足够灵活。我使用Stata的次数比其他任何一款都多,并且对它的选项非常满意(支持基于菜单和命令行的操作,足够好的插件系统来获得新的用户创建的模块,良好的图形支持)


这对于新手用户来说有点让人望而生畏,尽管它在生物统计学家中很受欢迎。因为它是免费的,这是另一个对它有利的观点。

再考虑一下Excel。它是众所周知的,并且广泛可用。参考这个或这个。

是另一个选项。

请举手。R对程序员非常友好。它有功能方面,是GNU

S-PLUS和R都基于S语言。两者都是相似的,在大多数情况下,您可以在R中作为S-PLUS程序运行,反之亦然

是另一种选择,尽管更倾向于BI和企业。SAS的语法比R简单,在我看来,对于非程序员来说更容易理解


其他选项包括SPSS、Matlab,甚至Excel。

听起来你在试图最大化多个目标。你说“这部分将被非编程用户(做临床研究)和程序员使用,所以我试图在可用性和自动化之间找到一个很好的折衷方案”,并隐含着这样一个假设,即在这两种情况下,这将是相同的工具,而这可能是不现实的。例如,Word和LaTeX的折衷方案是什么

关于要求的一些不同问题:

  • 对于程序员来说,它应该是可扩展的吗
    • 能够使用C扩展
    • 易于制定新的程序和方法
  • 非程序员想要使用什么分析
  • 图形
  • 不同组的易用性
因此,我读到:

易于扩展:R/S-plus,Matlab/Octave(我碰巧更喜欢R,但我做更多的统计和更少的矩阵运算) 易于普通人使用:Excel、自定义包装的R、SPSS

另外,windows上的R有一个有限的GUI,这可能会也可能不会帮助您的用户

如果是我,我会选择混合解决方案。使用R,并为非程序员提供一份常见任务的备忘单,说明常见任务,或者更好的是,编写一些名为“image\u summary”的包装函数,以自动化他们的探索工作


对于为R编写前端脚本,RPy python包装器也可能有所帮助

这比较了几种统计软件包的可用功能,以及它们的操作系统兼容性和定价信息(这似乎有点过时,但它给出了一个总体概念)

对于一个非技术用户可以使用的GUI统计软件包,我建议您使用“SAS企业指南”。您将获得通用和高级SAS程序、优秀的图形工具以及为技术用户编程的能力。我建议您从“SAS学习版”(SAS Learning Edition)开始,它是企业指南的一个功能齐全的版本,但一次只能处理1000行。它的价格不到500美元,这使得它非常划算。

SAS Enterprise Guide对于非程序员来说具有很好的可用性。此外,它还有很好的选项可以连接到Excel。对于程序员来说,这是最可靠的选择。sas服务器可以在任何设备上运行,但《企业指南》仅适用于Windows。

我们最终获得了Matlab统计工具箱(主要是因为我们团队中已经有一些Matlab经验,并且无论如何都需要该工具)


到目前为止,它正在做我们需要做的事情,并且很容易扩展。使用情况将显示非程序员是否真的使用它,但到目前为止,它看起来不错。

R对于任何类型的统计建模来说都是一种非常强大的语言。R是命令行驱动的;它没有GUI。我们已经尝试过Excel,坦率地说,它不能有效地提供我们所需要的。内置函数没有超出单向方差分析的范围,而且使用起来往往非常笨拙。是的,我可以在Excel中重新实现一个统计框架,但这并不是对我时间的最佳利用。更危险的是,众所周知Excel的分析工具包中存在缺陷,不适合回归。rcar,你在哪个国家?在美国制药公司,SAS在学术上比Stata或SPSS.US更为常见