Java jsoup以获取无序列表中的数据
我正在使用JSOUP提取数据。 我有一个html文件:Java jsoup以获取无序列表中的数据,java,jsoup,Java,Jsoup,我正在使用JSOUP提取数据。 我有一个html文件: = <ul> <li> <i> <a class="Class1" title="title1" href=""www.title1.com">title1</a> </i> (one) </li> <li> <i> <a title=title2" href="www.title2.com">title2</a&g
=
<ul>
<li>
<i>
<a class="Class1" title="title1" href=""www.title1.com">title1</a>
</i>
(one)
</li>
<li>
<i>
<a title=title2" href="www.title2.com">title2</a>
</i>
(two)
</li>
<li>
<i>
<a title="title3" href=""www.title2.com">title3</a>
</i>
(three)
</li>
</ul>
=
-
(一)
-
(二)
-
(三)
如何使用JSOUP打印标题1、标题2和标题3,
2) 如何打印HREF?非常简单:
Document doc = Jsoup.parse(html);
Element link = doc.select("a").first();
String title1 = link.attr("title");
//etc.
你看过了吗
还要确保HTML是正确的。e、 g.匹配报价
上面的HTML输出格式不正确,例如:
<a class="Class1" title="title1" href=""www.title1.com">title1</a>
^ extra quote
<a title=title2" href="www.title2.com">title2</a>
^ missing quote
^额外报价
^缺少报价
JSoup需要有效的HTML。我试过了,但它不起作用……是的,我看到了链接,我可以使用JSON执行一些操作。这是我看到的无序列表的isue。组可以轻松跳过列表。同时从hrefs中删除额外的报价-否则您将不会得到任何回报。我没有得到您所说的。对不起..您可以提供更多详细信息吗。我没有得到任何回报。我给的剪报是从一个页面,我想提取数据,我没有对该页面的控制这真的没有工作,因为我试图提取的网站是不是按照HTML syntex。谢谢你,雷默斯。我将为正确的syntex发布不同的消息