Java 如何使用GWT优化从MS Word复制的HTML文本?

Java 如何使用GWT优化从MS Word复制的HTML文本?,java,gwt,richtextbox,copy-paste,Java,Gwt,Richtextbox,Copy Paste,我的RichTextAreas有问题,所以我的问题是: 当我将从Ms Word或OpenOffice复制的文本粘贴到RichTextArea时,它保留了所有的文本样式,这是完美的,但有一个缺点是它的HTML文本足够大:(。 由于不必要的HTML标记,数据库的大小也在增加 我的问题是:“如何轻松优化HTML文本?” 谢谢!!! 有一个可以在Java程序中使用的API。RichTextArea基于浏览器的contentEditable支持。这意味着您将得到的HTML“标记汤”将是平台特定的、源代码特

我的
RichTextArea
s有问题,所以我的问题是: 当我将从Ms Word或OpenOffice复制的文本粘贴到RichTextArea时,它保留了所有的文本样式,这是完美的,但有一个缺点是它的HTML文本足够大:(。 由于不必要的HTML标记,数据库的大小也在增加

我的问题是:“如何轻松优化HTML文本?”

谢谢!!!


有一个可以在Java程序中使用的API。

RichTextArea
基于浏览器的
contentEditable
支持。这意味着您将得到的HTML“标记汤”将是平台特定的、源代码特定的和浏览器特定的。当您说“优化”时您的最终目标是什么?您希望保留多少原始格式?除了要粘贴的HTML的微小缩小之外,HTML复杂性的任何显著降低都可能导致视觉逼真度的损失

实用工具,或者它的任何一个衍生工具,可能会帮助你缩小化程度。如果你的目标是降低HTML的复杂性,你可以考虑使用一个圈养的服务器端浏览器在内存中渲染粘贴的内容,然后从HTMLUnit的DOM中提取你认为有用的属性。这是一种让搜索引擎能够抓取AJAX应用程序的方法


虽然降低视觉逼真度可能会让原始用户感到有点不安,但它确实为您提供了统一所有粘贴内容的视觉样式的机会。如果您基于许多用户的贡献构建网站,这种同质性会减少定向所需的脑力劳动量(即,查看您看到的内容)内容。

最后,我为自己的问题找到了答案: 我发现对我来说已经足够好了,它有从ms word复制选项,而且它的HTML优化非常出色