Java Jsoup删除未使用的元素
我尝试从程序中删除未使用的html标记和属性 我已经得到了所需要的元素。但是这个结果中的一些元素是不需要的,它们必须被删除。如何移除它们Java Jsoup删除未使用的元素,java,html,html-table,jsoup,Java,Html,Html Table,Jsoup,我尝试从程序中删除未使用的html标记和属性 我已经得到了所需要的元素。但是这个结果中的一些元素是不需要的,它们必须被删除。如何移除它们 Elements tes = doc.select("div.pd__content__row"); Elements spesifikasiProductContent = tes.select("[class=pd__spec__table]"); System.out.println(spesifikasiProductContent); 结果是: &
Elements tes = doc.select("div.pd__content__row");
Elements spesifikasiProductContent = tes.select("[class=pd__spec__table]");
System.out.println(spesifikasiProductContent);
结果是:
<table class="pd__spec__table">
<tbody>
<tr>
<td>Isi</td>
<td>750ml</td>
</tr>
<tr>
<td>Material</td>
<td>Tritan Material, ABS Plastic</td>
</tr>
<tr>
<td>Dimensi</td>
<td>21 X 15 X 3 Cm</td>
</tr>
<tr>
<td>Lain-lain</td>
<td>Dimensi : A5 <br> min. -20C, Max. 120C</td>
</tr>
<tr>
<td>Sertifikasi</td>
<td>CE / EU, CIQ, EEC, FDA, LFGB, SGS</td>
</tr>
<tr>
<td>Volume</td>
<td>< 0.500 L</td>
</tr>
</tbody>
</table>
三军情报局
750毫升
材料
Tritan材料,ABS塑料
迪曼西
21 X 15 X 3厘米
莱恩莱恩
尺寸:A5
最低-20摄氏度,最高120摄氏度
塞尔蒂菲卡西
CE/EU、CIQ、EEC、FDA、LFGB、SGS
卷
0.500升
预期结果:
Isi 750ml
Material Tritan Material, ABS Plastic
Dimensi 21 X 15 X 3 Cm
Lain-lain
Dimensi : A5 <br> min. -20C, Max. 120C
Sertifikasi CE / EU, CIQ, EEC, FDA, LFGB, SGS
Volume < 0.500 L
Isi 750ml
材料Tritan材料,ABS塑料
尺寸21 X 15 X 3厘米
莱恩莱恩
尺寸:A5
最低-20摄氏度,最高120摄氏度
Sertifikasi CE/EU、CIQ、EEC、FDA、LFGB、SGS
体积0.500升
使用行元素上的方法获取textnodes:
public java.lang.String text()
获取此元素的组合文本
和它所有的孩子。空白被规范化和修剪。对于
例如,给定HTML您好
,p.text()
返回
“你好!”
返回:
未编码文本,如果没有,则为空字符串
示例代码
List<String> featureTitleCleaned = new ArrayList<>();
Elements tes = doc.select("div.pd__content__row");
Elements spesifikasiProductContent = tes.select("[class=pd__spec__table]");
String cleaned = "";
for (Element element : spesifikasiProductContent) {
for (Element rowElement : element.select("tr")) {
cleaned += rowElement.text()+"\n";
}
featureTitleCleaned.add(cleaned);
cleaned = "";
}
for (String listElement : featureTitleCleaned) {
System.out.println(listElement);
}
List featureTitleClean=new ArrayList();
元素tes=文件选择(“div.pd__内容__行”);
元素spesifikasiProductContent=tes.select(“[class=pd\u spec\u table]”);
字符串=”;
for(元素:spesifikasiProductContent){
对于(元素行元素:元素。选择(“tr”)){
已清理+=行元素.text()+“\n”;
}
功能标题清洁。添加(清洁);
“已清理”;
}
用于(字符串列表元素:FeatureTitleClean){
System.out.println(列表元素);
}
输出
Isi 750ml
Material Tritan Material, ABS Plastic
Dimensi 21 X 15 X 3 Cm
Lain-lain Dimensi : A5 min. -20C, Max. 120C
Sertifikasi CE / EU, CIQ, EEC, FDA, LFGB, SGS
Volume < 0.500 L
Isi 750ml
材料Tritan材料,ABS塑料
尺寸21 X 15 X 3厘米
路面尺寸:最低温度为5℃-20℃,最高温度为120℃
Sertifikasi CE/EU、CIQ、EEC、FDA、LFGB、SGS
体积<0.500升
您好,您还在吗?如何将每个已清理的元素放入列表?列表功能TitleClean=null;对于(元素rowElement:feature.select(“div.h3”){featureTitleClean.add(rowElement.text());}