Stata 打开非常大的Excel文件
我收到了Excel格式的数据,我想将其导入Stata 该文件非常大,我得到以下错误: “您试图打开的文件太大。Stata 打开非常大的Excel文件,stata,Stata,我收到了Excel格式的数据,我想将其导入Stata 该文件非常大,我得到以下错误: “您试图打开的文件太大。 *.xlsx文件允许的最大大小(40 mb) 显然,这不是我的首选格式,但我可以通过只输入指定的列来解决问题吗?命令的帮助文件导入excel清楚地说明: “…为了提高性能,导入excel对excel 2007/2010(.xlsx)文件的大小限制为40 MB…” 您可以通过从Excel中将文件保存为csv(例如myfilename)来绕过此限制 然后,您可以使用Stata的导入分隔的命
*.xlsx文件允许的最大大小(40 mb)
显然,这不是我的首选格式,但我可以通过只输入指定的列来解决问题吗?命令的帮助文件
导入excel
清楚地说明:
“…为了提高性能,导入excel对excel 2007/2010(.xlsx)文件的大小限制为40 MB…”
您可以通过从Excel中将文件保存为csv
(例如myfilename)来绕过此限制
然后,您可以使用Stata的导入分隔的
命令执行此任务:
import delimited myfilename.csv, clear
请注意,如果您的计算机上没有安装Microsoft Excel,您还可以在Python或R中执行从
xlsx
到csv
的转换 每当我需要导入大型Excel文件时,我都会使用以下方法:
set excelxlsxlargefile on
我知道我的计算机在加载时可能会变慢,但我不想经历将.xlsx
转换为.csv
文件的麻烦
希望有一天你会发现这个功能很有用。这是一个未记录的功能,遗憾的是,根据我的经验,它并不总是有效。Stata在这个过程中经常崩溃。另一方面,
csv
方法每次都有效,我怀疑这就是为什么excelxlsxlagefile
仍然没有文档记录的原因。很高兴知道,尽管我从未遇到过这种情况(我没有多次使用它)。它会很快崩溃,还是会尝试导入(比如)10分钟然后崩溃?如果它很快崩溃,可能值得一试;我想不会有什么损失。它会导致Stata以随机间隔崩溃,每次都取决于文件的大小。这可能是因为通过xml
文件的内存开销很大。关键是这是一个不可靠的特性,通常不应该使用。