使用POI事件模型读取Excel文件

使用POI事件模型读取Excel文件,excel,apache-poi,Excel,Apache Poi,我想使用ApachePOI的HSSF事件模型读取Excel文件(.xls格式)。我的excel工作表是一个简单的excel文件,没有宏。我只是想知道我需要处理哪些类型的记录 以下是excel文件中的数据类型:- 1. String 2. Boolean 3. Number 4. Date. 我找到了这些布勒,空白,数字。让我知道我还需要处理哪些记录 谢谢 Srinivasan如果希望数字和日期像在Excel中一样显示,则需要所有单元格格式信息。这是因为数字和日期

我想使用ApachePOI的HSSF事件模型读取Excel文件(.xls格式)。我的excel工作表是一个简单的excel文件,没有宏。我只是想知道我需要处理哪些类型的记录

以下是excel文件中的数据类型:-

    1. String
    2. Boolean
    3. Number
    4. Date.
我找到了这些布勒,空白,数字。让我知道我还需要处理哪些记录

谢谢
Srinivasan

如果希望数字和日期像在Excel中一样显示,则需要所有单元格格式信息。这是因为数字和日期单元格都以相同的方式存储,作为浮点数,每个记录存储一个单元格(MulRks周围的一些特殊情况除外),只有格式化规则才能告诉您是日期还是数字以及如何显示它们

我建议您看两个使用HSSF事件模型对.xls文件进行基于事件提取的优秀示例。第一个是POI本身,它提供纯文本输出。第二个是ApacheTika,它提供了一个XHTML版本

在这两者中,您将看到只注册和处理少数记录SID的代码,还将看到它们的用途。您还将看到如何在使用事件模型时访问POI的格式代码,您需要使用事件模型来获得正确的数字和日期


您可能还想看看另一个POI示例,它显示了如何处理未使用的行和单元格通常不会显示在Excel文件中的事实。对于文本提取来说,这不是一个问题,但是对于CSV导出之类的东西,知道缺少单元格或行,并且知道有多少是关键

如果希望数字和日期像在Excel中一样显示,则需要所有单元格格式信息。这是因为数字和日期单元格都以相同的方式存储,作为浮点数,每个记录存储一个单元格(MulRks周围的一些特殊情况除外),只有格式化规则才能告诉您是日期还是数字以及如何显示它们

我建议您看两个使用HSSF事件模型对.xls文件进行基于事件提取的优秀示例。第一个是POI本身,它提供纯文本输出。第二个是ApacheTika,它提供了一个XHTML版本

在这两者中,您将看到只注册和处理少数记录SID的代码,还将看到它们的用途。您还将看到如何在使用事件模型时访问POI的格式代码,您需要使用事件模型来获得正确的数字和日期


您可能还想看看另一个POI示例,它显示了如何处理未使用的行和单元格通常不会显示在Excel文件中的事实。对于文本提取来说,这不是一个问题,但是对于CSV导出之类的东西,知道缺少单元格或行,并且知道有多少是关键

但是你想从你的档案中得到什么?文本?数字?格式化?风格?床单名称?链接?图像?您对获取内容的要求很大程度上决定了哪些记录是重要的……我只想要文本、日期和数字,不想要样式、图像、样式……等等原始浮点数,还是excel中的数字?另外,原始Excel日期(自1900/1904年以来的天数)或Excel中显示的日期?数字和日期与Excel中显示的日期相同。但是,您希望从文件中获得哪些内容?文本?数字?格式化?风格?床单名称?链接?图像?您对获取内容的要求很大程度上决定了哪些记录是重要的……我只想要文本、日期和数字,不想要样式、图像、样式……等等原始浮点数,还是excel中的数字?此外,原始Excel日期(自1900/1904年起的天数)或Excel中显示的日期?Excel中显示的数字和日期。