Apache 按原始文件名或文件类型检索Excel嵌入的对象

Apache 按原始文件名或文件类型检索Excel嵌入的对象,apache,apache-poi,Apache,Apache Poi,我有一个Excel表格,允许用户单击特定单元格并附加/嵌入文件。是否有API可用于按文件名或文件类型检索这些文件?我尝试了ApachePOI来阅读PackagePart并在那里获取内容。我试过POIFS文件系统。我还尝试了ApacheTika(tikaConfigGetDetector())来获取mime类型 它们都返回相同的信息:OLEObject1.bin、OLEObject2.bin、OLEObject3.bin等或无法用于区分文件的字符串 如果我试图区分PDF、PPT或XLS,这很简单,

我有一个Excel表格,允许用户单击特定单元格并附加/嵌入文件。是否有API可用于按文件名或文件类型检索这些文件?我尝试了ApachePOI来阅读PackagePart并在那里获取内容。我试过POIFS文件系统。我还尝试了ApacheTika(tikaConfigGetDetector())来获取mime类型

它们都返回相同的信息:OLEObject1.bin、OLEObject2.bin、OLEObject3.bin等或无法用于区分文件的字符串

如果我试图区分PDF、PPT或XLS,这很简单,但是我需要查找特定的文件类型和/或名称,以便知道如何正确处理它们以供进一步检查


还有什么方法可以通过通用的OLEObject1.bin格式吗?

您是否尝试过解包OLE对象以查看其中的内容?我已广泛搜索了这些对象,以查找可用的内容。使用Apache POI或TIKA向下钻取几层,得到了“/xl/embeddings/oleObject1.bin”或“application/vnd.opemxmlformats…”,或者仅仅是oleObject1.bin。例如,如果原始文件名是example.txt或example.wsq,是否有办法检索“example”或“.txt”或“.wsq”?尝试查看ole对象内部(使用TIKA或POI),您是否找到嵌入其中的文本文件?