如何在HTML中表达语义正确的分页符?

如何在HTML中表达语义正确的分页符?,html,xhtml,Html,Xhtml,我正在用HTML编辑书籍/文章。这些文本打印一次,我扫描它们,将它们转换成中间XML格式,然后将它们转换成HTML(通过XSLT)。因为这些文本中的一些已经从今天的市场上消失了,并且只能通过主要的图书馆获得,所以我想出版它们,以便人们可以通过参考原始文档中的页码引用它们。为此,我的中间XML格式有一个标记分页符的元素。现在我正在进行XML->HTML转换,我想知道如何在HTML中转换这些分页符。默认情况下,它们不应该出现在最终的HTML中(因此一个简单的|不合适),但我计划用一些轻量级JavaS

我正在用HTML编辑书籍/文章。这些文本打印一次,我扫描它们,将它们转换成中间XML格式,然后将它们转换成HTML(通过XSLT)。因为这些文本中的一些已经从今天的市场上消失了,并且只能通过主要的图书馆获得,所以我想出版它们,以便人们可以通过参考原始文档中的页码引用它们。为此,我的中间XML格式有一个标记分页符的元素。现在我正在进行XML->HTML转换,我想知道如何在HTML中转换这些分页符。默认情况下,它们不应该出现在最终的HTML中(因此一个简单的|不合适),但我计划用一些轻量级JavaScript包装这些文档,在需要时显示标记。我想到了默认情况下隐藏的带有|的
s


有没有更好的、可能是“语义”的方法来解决这个问题?

也许您可以使用一个不被html解析/解释的xml标记,比如

通过这种方式查看html,不会呈现标记,而是使用jQuery或任何其他Javascript库,在被询问时,转换标准
或任何可视标记中的这些特定标记


我认为这可能是一种语义方法…

分页符在很大程度上是布局的一部分,HTML不是用来描述布局的,因此在语言中找不到任何与此相关的语义

你所能期望的最好的是某种混乱

由于在段落的中间可以出现分页,并且<代码> 元素可以只包含内联元素,从一开始就可以消除大部分选项。

对我来说,这两种可能性是
(来自已失效的XHTML2草稿)并标记原始文档的每一行。添加一个类将指示新页面的起始位置(如果您希望,您可以使用CSS计数器和边框清楚地指示每个页面和编号)。遗憾的是,浏览器供应商拒绝支持真正的语义标记语言,转而支持HTML5

为每个页面使用
,并具有包含以下内容的样式表:

.Page {
   page-break-after: always;
}

…当段落中间出现分页符时?我可以为这一个元素使用单独的名称空间进行验证吗?(就像word导出为html时所做的那样)。然后我还能用javascript处理这个元素吗?是的,不是HTML方法,而是XHTML方法@Struce:你可以为你的特殊标记使用一个名称空间,让Javascript处理它们,并将它们转换成其他标准的、可见的XHTML标记。我想我必须在span或a中放入一些东西,因为Chrome似乎不喜欢空的(它会在一个空span之后将下一个元素吸入其中,直到下一个span出现[是的,它关闭了!]-这就是我在开发工具中看到的…)无论如何,谢谢。我会选择带有“a”的东西,因为链接…以后可能会有用。