Java 从Html代码中删除css和脚本标记

Java 从Html代码中删除css和脚本标记,java,html-parser,Java,Html Parser,我有一条像绳子一样的线 <div style="width:100%"><table><tr class="abc"><td class="tdcss">some data</td></tr></table> </div> 一些数据 strong文本 我想删除所有的类和样式标签(我指的是css和脚本标签)。 我想要我的绳子像 <div> <table> <tr>

我有一条像绳子一样的线

<div style="width:100%"><table><tr class="abc"><td class="tdcss">some data</td></tr></table> 
</div>
一些数据
strong文本 我想删除所有的类和样式标签(我指的是css和脚本标签)。 我想要我的绳子像

<div>
<table>
<tr>
<td>
some data
</td>
</tr>
</table>
</div>

一些数据
我必须使用java来实现这一点。 有谁能帮我找到风格索引吗 2) 然后查找“”的下一个索引 然后删除这两个索引之间的字符串。 课堂上也是如此


字符串没有提供其他方法。您必须解析字符串并使用replace()或substring()方法如果字符串相当小,您可以选择使用正则表达式。replaceAll接受正则表达式和替换字符串。所以你可以试试
yourString=yourString.replaceAll(“style=\\”+?\\”,“”)
yourString=yourString.replaceAll(“class=\\”+?\\”,“”)

试一试
它在一个示例字符串上有一个很棒的正则表达式生成器asnd计算器。

到目前为止,您尝试了什么?