Java 文件格式转换库

Java 文件格式转换库,java,html,file-format,Java,Html,File Format,是否有满足/超过以下要求的知名解决方案 从多种非图形文档格式到HTML的转换(例如DOCTML、pdfhtml、odthtml等) 命令行或API(最好是Java API) 跨平台 商业还是开源 OpenOffice有一个丰富的API,支持各种支持的格式之间的转换。检查问题。它建议使用。,您可以导出到各种输出格式,但还原总是很困难。对于pdf,您可以尝试I(已经编写了一个多合一的Tex/LaTeX->HTML和ASCII文本以及RTF转换器), 我会说这将是一项艰巨的任务 问题是,这些不同的“

是否有满足/超过以下要求的知名解决方案

  • 从多种非图形文档格式到HTML的转换(例如DOCTML、pdfhtml、odthtml等)
  • 命令行或API(最好是Java API)
  • 跨平台
  • 商业还是开源

OpenOffice有一个丰富的API,支持各种支持的格式之间的转换。检查问题。它建议使用。

,您可以导出到各种输出格式,但还原总是很困难。对于pdf,您可以尝试

I(已经编写了一个多合一的Tex/LaTeX->HTML和ASCII文本以及RTF转换器), 我会说这将是一项艰巨的任务

问题是,这些不同的“文档”格式用于不同的目的。 虽然在某些格式之间确实存在这样的转换工具, 在“文件”的结构、含义和实施方面,通常存在概念上的差异 而且,通常有必要在一种格式支持的功能上进行权衡,以便将它们组合在一起 在另一个系统中可接受的输出。 例如,PDF在表示、精确定位和支持字体方面非常强大,其中 因为HTML更关注的是结构,而实际上对这些东西没有持续时间 (没有CSS)

我很好奇,你如何设想这样一个API被使用,
通常有人只是想要一个转换程序?

您确定需要pdf->html(或任何其他格式)吗。我认为没有任何图书馆可供这方面使用。就我所知,对于pdf来说,这是一种方法。事实上,这是可能的,但有一些限制。看看这个: