Java Jsoup select不返回所有元素
我是Jsoup图书馆的新手。我有这样的htmlJava Jsoup select不返回所有元素,java,scala,web-scraping,jsoup,Java,Scala,Web Scraping,Jsoup,我是Jsoup图书馆的新手。我有这样的html <tr class="srrowns"> <td class="num"> <a name="y2015"> </a> 1 </td> <td nowrap><a href="/cve/CVE-2015-4004/" title="CVE-2015-4004 security vulnerability details">CVE-2015-4004</
<tr class="srrowns">
<td class="num"> <a name="y2015"> </a> 1 </td>
<td nowrap><a href="/cve/CVE-2015-4004/" title="CVE-2015-4004 security vulnerability details">CVE-2015-4004</a></td>
<td><a href="/cwe-details/119/cwe.html" title="CWE-119 - CWE definition">119</a></td>
<td class="num"> <b style="color:red"> </b> </td>
<td> DoS Overflow +Info </td>
<td>2015-06-07</td>
<td>2015-06-08</td>
<td>
<div class="cvssbox" style="background-color:#ff8000">
8.5
</div></td>
<td align="center">None</td>
<td align="center">Remote</td>
<td align="center">Low</td>
<td align="center">Not required</td>
<td align="center">Partial</td>
<td align="center">None</td>
<td align="center">Complete</td>
</tr>
显然,删除“完成”
之前的无。是否有任何方法可以从Jsoup选择器获取所有项目
我的代码在Scala中看起来像这样
val connection = Jsoup.connect(url).get()
val treelist = connection.select("tr.srrowns:contains(CVE-2015-4001)")
val tree = tree.select("td")
我刚刚看到Jsoup select是使用LinkedHashSet实现的。我的目标是使用Jsoup.text()
从每个标记中提取文本。是否有解决方法,或者我是否需要编写解析器来获取所有节点(包括重复节点)
多谢各位 试试这个CSS选择器:
tr.srrowns:has(td:contains(CVE-2015-4004)) > td
演示
示例代码
var cve=“cve-2015-4004”;
val doc=Jsoup.connect(url.get())
val tds=doc.select(“tr.srrowns:has(td:contains(“+cve+”)”)>td”)
你能发布更多的代码吗?嗨,我刚刚添加了我写的代码。
tr.srrowns:has(td:contains(CVE-2015-4004)) > td
var cve = "CVE-2015-4004";
val doc = Jsoup.connect(url).get()
val tds = doc.select("tr.srrowns:has(td:contains(" + cve + ")) > td")
for( var td <- tds ){
println( td.text() );
}