使用SAX+SXSSF编辑大型excel文件

使用SAX+SXSSF编辑大型excel文件,excel,apache-poi,sax,Excel,Apache Poi,Sax,我正在尝试使用SXSSF编辑现有的excel文件。此excel可能包含100万条记录。我必须验证excel中的每一行,如果记录无效,则在行的最后一列中添加错误消息,其中包含错误。验证过程首先完成,届时我会记下无效的行号。一旦所有的验证都结束了,我将复制一份文件,并在每个失败行的末尾写入错误详细信息。 因为SXSSF是只写的,所以当我试图获取带有行号的无效行时,得到的是空值。请提出更好的解决方法 我在下面的线程中遇到了一些使用SAX+SXSSF的建议 我知道如何使用SAX阅读excel。但是我不知

我正在尝试使用SXSSF编辑现有的excel文件。此excel可能包含100万条记录。我必须验证excel中的每一行,如果记录无效,则在行的最后一列中添加错误消息,其中包含错误。验证过程首先完成,届时我会记下无效的行号。一旦所有的验证都结束了,我将复制一份文件,并在每个失败行的末尾写入错误详细信息。 因为SXSSF是只写的,所以当我试图获取带有行号的无效行时,得到的是空值。请提出更好的解决方法

我在下面的线程中遇到了一些使用SAX+SXSSF的建议

我知道如何使用SAX阅读excel。但是我不知道如何将其与SXSSF关联并编辑excel。但是如果有人共享一个示例代码,那就太好了


提前谢谢。

你能不能不走捷径,在服务器上再增加几GB内存,然后用XSSF来完成这一切?好的。由于我们可能必须在一天内处理n个这样的记录,我们还担心速度。这是我们从XSSF方法转向SAX+XSSF方法来读取excel的唯一原因。通过这种方法,我们可以在读取excel数据时看到速度上的巨大差异。这种速度差异与程序员的时间相比如何?每天节省5分钟的处理时间,却要花费程序员数周的时间,这可能完全没有意义,没错。但是在读取一个30KB的excel文件时,我们发现了XSSF3秒与SAX700ms的差异。希望这是一个相当大的差异,当涉及到巨大的文件。这似乎慢了我。A 50列,2000行,420kb.xlsx的加载速度比我的笔记本电脑快!你能不能试着用这个方法,再仔细检查一下你的设置和/或文件是否有问题?