比PDF或EPUB更好的文件格式?

比PDF或EPUB更好的文件格式?,pdf,markup,epub,documentviewer,Pdf,Markup,Epub,Documentviewer,我的客户希望我们为他们的应用程序构建一个自定义文档查看器。(它确实需要定制,因为它们需要大量特定于应用程序的功能。) 去年我们为他们制作了一个PDF,生成页面图像,并使用隐藏的文本层对图像进行备份,可以选择和复制。我们用Flex做的。那是一场噩梦。PDF是可怕的 今年,我们需要在HTML5中构建一个具有类似要求的文档,除了现在大多数文档都是Word或HTML,也就是说,它们具有可回流的文本,而不是PDF的固定布局和字形。但他们仍然希望在同一个查看器中制作PDF 我认为我们需要将所有文档转换为一些

我的客户希望我们为他们的应用程序构建一个自定义文档查看器。(它确实需要定制,因为它们需要大量特定于应用程序的功能。)

去年我们为他们制作了一个PDF,生成页面图像,并使用隐藏的文本层对图像进行备份,可以选择和复制。我们用Flex做的。那是一场噩梦。PDF是可怕的

今年,我们需要在HTML5中构建一个具有类似要求的文档,除了现在大多数文档都是Word或HTML,也就是说,它们具有可回流的文本,而不是PDF的固定布局和字形。但他们仍然希望在同一个查看器中制作PDF

我认为我们需要将所有文档转换为一些通用的文件格式,既可以处理可回流文本,也可以处理PDF的固定位置图示符。(每个文档可能支持其中一个,但不能同时支持两个)。如果它是一种类似XML的标记语言,它会说:

<text>here's some text</text>

-- or -- 

<glyph letter="a" name="my_a_glyph" position="10,10"/>
<image src="my_image" position="20,20"/>
这里有一些文本
--或者--
或者类似的


是否有任何现有的文件格式可以处理它?EPUB不会做固定位置的文本,PDF的描述方式太多了。

我想你可以看看FB2(虚构书2)格式。这是一种基于XML的格式,专为出版书籍而设计。它包括图像,尽管我不确定它们是否可以完全对齐


此外,您可以简单地使用HTML,并在需要时进行HTML到PDF的呈现(有各种组件和库用于此)。我看不出(或者你没有列出)这种方法不起作用的任何原因

格罗夫?可以根据需要构建一个宏库来定制它

Groff/troff/nroff是Unix的“run-off”程序,可以输出为postscript或HTML。从postscript到PDF的跳转内置于某些PDF查看器中;还有几个现有的it程序,例如pstopdf

GROFF有一些固定的布局选项和一些流式选项。使用GROFF,在被禁止的范围内,将大部分打印输出基于流动文本几乎更容易