Java 使用jsoup解析表数据
我在我的android应用程序中使用解析html代码,但现在我需要解析表数据,我无法让它工作。我尝试了很多方法,但都不成功,所以如果有人有经验,我想在这里试试运气 这是我的html的一部分:Java 使用jsoup解析表数据,java,android,html-parsing,jsoup,string-parsing,Java,Android,Html Parsing,Jsoup,String Parsing,我在我的android应用程序中使用解析html代码,但现在我需要解析表数据,我无法让它工作。我尝试了很多方法,但都不成功,所以如果有人有经验,我想在这里试试运气 这是我的html的一部分: <div id="editacia_jedla"> <h2>My header</h2> <h3>My sub header</h3> <table border="0" class="jedalny_listok_
<div id="editacia_jedla">
<h2>My header</h2>
<h3>My sub header</h3>
<table border="0" class="jedalny_listok_tabulka" cellpadding="2" cellspacing="1">
<tr>
<td width="100" class="menu_nazov neparna" align="left">Food Menu 1</td>
<td class="jedlo neparna" align="left">vegetable and beef
<div class="jedlo_box_alergeny">Allergens: <a href="#" class="alergen_1">1</a>, <a href="#" class="alergen_3">3</a></div>
</td>
</tr>
<tr>
<td width="100" class="menu_nazov parna" align="left">Food Menu 2</td>
<td class="jedlo parna" align="left">Potato salad and pork
<div class="jedlo_box_alergeny">Allergens: <a href="#" class="alergen_6">6</a></div>
</td>
</tr>
</table>
etc
</div>
try {
String tableHtmlCode="";
Document fullHtmlDocument = Jsoup.connect(urlOfFoodDay).get();
Element elm1 = fullHtmlDocument.select("#editacia_jedla").first();
for( Element element : elm1.children() )
{
tableHtmlCode+=element.getElementsByIndexEquals(2); //this set table content because 0=h2, 1=h3
}
Document parsedTableDocument = Jsoup.parse(tableHtmlCode);
//Element th = parsedTableDocument.select("td[class=jedlo neparna]").first(); THIS IS BAD
String foodContent="";
String foodAllergens="";
}
因此,现在我想要提取文本蔬菜和牛肉,并将其保存到字符串foodContent和div classjedlo_box_alergeny中的数字1,3(一起)保存到字符串foodAllergens。有人能帮忙吗?如果您有任何想法,我将不胜感激。反复浏览您文档的父标签
jedalny\u listok\u tabulka
,并循环浏览td
标签
td
标记是包含过敏值的href
标记的父级。因此,您可以循环标记a
元素以获取您的数字,例如:
Elements myElements = doc.getElementsByClass("jedalny_listok_tabulka")
.first().getElementsByTag("td");
for (Element element : myElements) {
if (element.className().contains("jedlo")) {
String foodContent = element.ownText();
String foodAllergen = "";
for (Element href : element.getElementsByTag("a")) {
foodAllergen += " " + href.text();
}
System.out.println(foodContent + " : " + foodAllergen);
}
}
输出:
vegetable and beef : 1 3
Potato salad and pork : 6