Stata 打开非常大的Excel文件

Stata 打开非常大的Excel文件,stata,Stata,我收到了Excel格式的数据,我想将其导入Stata 该文件非常大,我得到以下错误: “您试图打开的文件太大。 *.xlsx文件允许的最大大小(40 mb) 显然,这不是我的首选格式,但我可以通过只输入指定的列来解决问题吗?命令的帮助文件导入excel清楚地说明: “…为了提高性能,导入excel对excel 2007/2010(.xlsx)文件的大小限制为40 MB…” 您可以通过从Excel中将文件保存为csv(例如myfilename)来绕过此限制 然后,您可以使用Stata的导入分隔的命

我收到了Excel格式的数据,我想将其导入Stata

该文件非常大,我得到以下错误:

“您试图打开的文件太大。
*.xlsx文件允许的最大大小(40 mb)


显然,这不是我的首选格式,但我可以通过只输入指定的列来解决问题吗?

命令的帮助文件
导入excel
清楚地说明:

“…为了提高性能,导入excel对excel 2007/2010(.xlsx)文件的大小限制为40 MB…”

您可以通过从Excel中将文件保存为
csv
(例如myfilename)来绕过此限制

然后,您可以使用Stata的
导入分隔的
命令执行此任务:

import delimited myfilename.csv, clear

请注意,如果您的计算机上没有安装Microsoft Excel,您还可以在Python或R中执行从
xlsx
csv
的转换

每当我需要导入大型Excel文件时,我都会使用以下方法:

set excelxlsxlargefile on
我知道我的计算机在加载时可能会变慢,但我不想经历将
.xlsx
转换为
.csv
文件的麻烦


希望有一天你会发现这个功能很有用。

这是一个未记录的功能,遗憾的是,根据我的经验,它并不总是有效。Stata在这个过程中经常崩溃。另一方面,
csv
方法每次都有效,我怀疑这就是为什么
excelxlsxlagefile
仍然没有文档记录的原因。很高兴知道,尽管我从未遇到过这种情况(我没有多次使用它)。它会很快崩溃,还是会尝试导入(比如)10分钟然后崩溃?如果它很快崩溃,可能值得一试;我想不会有什么损失。它会导致Stata以随机间隔崩溃,每次都取决于文件的大小。这可能是因为通过
xml
文件的内存开销很大。关键是这是一个不可靠的特性,通常不应该使用。