从Python、Java(groovy/grails)和#x27;或C++;没有SPSS许可证的应用程序?

从Python、Java(groovy/grails)和#x27;或C++;没有SPSS许可证的应用程序?,java,c++,python,spss,Java,C++,Python,Spss,我发现谷歌搜索的结果好坏参半。我需要解析SPSS.sav文件,以发现数据布局并提取调查结果。第一步是读取数据的“模式”。例如,我需要知道问题及其允许回答的类型。我计划在我自己的SQL表中对这些数据进行建模,这样我就可以根据我的应用程序要求对其进行切片。第二步是用回答者的答案填充我的数据模型。查看SPSS sav文件,我相信它包含了我要查找的两种类型的数据 我不需要或想要昂贵的SPSS软件,如果我不严格要求的话。我们不会对这些数据进行统计,只会根据答案过滤器选择受访者的子集。SPSS文件将由许可S

我发现谷歌搜索的结果好坏参半。我需要解析SPSS.sav文件,以发现数据布局并提取调查结果。第一步是读取数据的“模式”。例如,我需要知道问题及其允许回答的类型。我计划在我自己的SQL表中对这些数据进行建模,这样我就可以根据我的应用程序要求对其进行切片。第二步是用回答者的答案填充我的数据模型。查看SPSS sav文件,我相信它包含了我要查找的两种类型的数据

我不需要或想要昂贵的SPSS软件,如果我不严格要求的话。我们不会对这些数据进行统计,只会根据答案过滤器选择受访者的子集。SPSS文件将由许可SPSS的合作伙伴公司提供。我不需要将任何数据输出回SPSS;我的用例是只读的

我可以使用Python、Java和Groovy,或C/C++作为我的解析器程序。此程序将在数据采集结束时运行一次,因此性能不是特别重要。理想情况下,我希望我的代码是跨平台的,这样我就可以在Mac上开发并部署到Linux,但如果必须的话,我可以使用windows


我发现的很多东西要么是2004年的java类,要么是现代Python代码,它们需要IBM提供的DLL,并且是特定于windows的。基于我对需求的快速解释,我将感谢SO社区的建议。我认为我的需求很简单,但还没有找到我所希望的。开源库是理想的,但我甚至愿意以合理的价格购买一个简单的商业解决方案。

显然可以读取SPSS数据文件。我还在PSPP源代码中提供了一个指向的链接,不过它附带了一个警告“不要尝试直接读取/写入此格式。”

您可以免费获得带有详细文档的SPSS I/o模块,以便构建自己的应用程序来读取(或写入)sav文件。这些模块适用于SPSS统计支持的所有平台

转到SPSS社区网站,并按照链接下载SPSS。你必须注册,但那是免费的

SAV文件是一种二进制格式,具有许多复杂的结构,因此最好使用i/o模块。如果SAV文件中添加了新功能(这种情况经常发生),i/o模块将同时更新,因此代码不会过时

嗯,,
Jon Peck

这里有一个java库:


谢谢。我正在下载。我在谷歌上看到了这一点,但我只希望有一个库可以让我从Python访问。但如果有必要,我非常愿意用C编写解析器,这是一个合理的选择。我将检查这一点,同时继续为Python或Java寻找更小的组件。PSPP的一些特性确实可以通过库使用,而且由于存在一个显然可以读取系统文件的包装器,因此至少在原则上可以为Python创建类似的包装器。或者,您也可以编写一个PSPP脚本来读取数据并以更易于管理的格式输出,并以非交互方式将其称为PSPP。我今天要试试。唯一令人沮丧的是依赖窗口,所以我一直在尝试其他解决方案。似乎还有一个ODBC驱动程序可用。看来有很多选择。仍然愿意接受以前做过这件事的人的更多想法或建议。