Java 从Html代码中删除css和脚本标记
我有一条像绳子一样的线Java 从Html代码中删除css和脚本标记,java,html-parser,Java,Html Parser,我有一条像绳子一样的线 <div style="width:100%"><table><tr class="abc"><td class="tdcss">some data</td></tr></table> </div> 一些数据 strong文本 我想删除所有的类和样式标签(我指的是css和脚本标签)。 我想要我的绳子像 <div> <table> <tr>
<div style="width:100%"><table><tr class="abc"><td class="tdcss">some data</td></tr></table>
</div>
一些数据
strong文本
我想删除所有的类和样式标签(我指的是css和脚本标签)。
我想要我的绳子像
<div>
<table>
<tr>
<td>
some data
</td>
</tr>
</table>
</div>
一些数据
我必须使用java来实现这一点。
有谁能帮我找到风格索引吗
2) 然后查找“”的下一个索引
然后删除这两个索引之间的字符串。
课堂上也是如此
字符串没有提供其他方法。您必须解析字符串并使用replace()或substring()方法如果字符串相当小,您可以选择使用正则表达式。replaceAll接受正则表达式和替换字符串。所以你可以试试
yourString=yourString.replaceAll(“style=\\”+?\\”,“”)代码>
yourString=yourString.replaceAll(“class=\\”+?\\”,“”)代码>
试一试
它在一个示例字符串上有一个很棒的正则表达式生成器asnd计算器。到目前为止,您尝试了什么?