Java 如何将MS Word HTML文档转换为干净的XHTML内联样式?
我有一个内部CSS的问题。Jsoup不解析Java 如何将MS Word HTML文档转换为干净的XHTML内联样式?,java,css,ms-word,html-parsing,jsoup,Java,Css,Ms Word,Html Parsing,Jsoup,我有一个内部CSS的问题。Jsoup不解析@font-face或类似的内容。如何清理MS Word HTML文档?这是我的经验 我们也必须解析word文档,但是复杂的word内容阻止了我们。我们有一个富文本编辑器,它允许将word中的内容传递到其中,然后我们将该内容提交给服务器,通过jsoup对其进行解析 它可能无法解决您的问题,但只能解决我的2美分。当Jsoup使用CSS选择器选择HTML元素时,它不是CSS解析器,而是纯HTML解析器。这里已经回答了这个问题:
@font-face
或类似的内容。如何清理MS Word HTML文档?这是我的经验
我们也必须解析word文档,但是复杂的word内容阻止了我们。我们有一个富文本编辑器,它允许将word中的内容传递到其中,然后我们将该内容提交给服务器,通过jsoup对其进行解析
它可能无法解决您的问题,但只能解决我的2美分。当Jsoup使用CSS选择器选择HTML元素时,它不是CSS解析器,而是纯HTML解析器。这里已经回答了这个问题: