Java 使用jsoup从另一个div类中提取div类
我正在尝试从另一个div类中的div类提取href。我尝试使用的代码片段的一个示例是:Java 使用jsoup从另一个div类中提取div类,java,html-parsing,jsoup,Java,Html Parsing,Jsoup,我正在尝试从另一个div类中的div类提取href。我尝试使用的代码片段的一个示例是: <div class="productData"> <div class="productTitle"> <a href="https://rads.stackoverflow.com/amzn/click/com/0786866020" rel="nofollow noreferrer"> Fish! A Remarkabl
<div class="productData">
<div class="productTitle">
<a href="https://rads.stackoverflow.com/amzn/click/com/0786866020" rel="nofollow noreferrer"> Fish! A Remarkable Way to Boost Morale and Improve Results</a>
<span class="ptBrand">by <a href="/Stephen-C.-Lundin/e/B001H6UE16">Stephen C. Lundin</a>, <a href="/Harry-Paul/e/B001H9XQJA">Harry Paul</a>, <a href="/John- Christensen/e/B003VKXJ04">John Christensen</a> and Ken Blanchard</span>
<span class="binding"> (<span class="format">Hardcover</span> - Mar. 8, 2000) </span>
</div>
我得到空值。尝试提取更高的元素,例如:
Element title = doc.getElementById("div.productData");
我也得到空值。我尝试了许多代码组合,但无法找出从内部div类或内部id提取的语法
任何帮助都将不胜感激。您正在尝试使用
getElementById()
按ID选择元素。这是错误的。那些div没有ID,而是有一个类名。您应该改用select()
方法
Element title = doc.select("div.productTitle").first();
请注意,classname选择器不一定返回单个元素。文档中可以有多个。我假设您需要第一个也是唯一的元素
,因此我在示例中添加了first()
调用
Element title = doc.select("div.productTitle").first();