Java 使用jsoup从另一个div类中提取div类

Java 使用jsoup从另一个div类中提取div类,java,html-parsing,jsoup,Java,Html Parsing,Jsoup,我正在尝试从另一个div类中的div类提取href。我尝试使用的代码片段的一个示例是: <div class="productData"> <div class="productTitle"> <a href="https://rads.stackoverflow.com/amzn/click/com/0786866020" rel="nofollow noreferrer"> Fish! A Remarkabl

我正在尝试从另一个div类中的div类提取href。我尝试使用的代码片段的一个示例是:

<div class="productData"> 
           <div class="productTitle">
            <a href="https://rads.stackoverflow.com/amzn/click/com/0786866020" rel="nofollow noreferrer"> Fish! A Remarkable Way to Boost Morale and Improve Results</a> 
            <span class="ptBrand">by <a href="/Stephen-C.-Lundin/e/B001H6UE16">Stephen C.     Lundin</a>, <a href="/Harry-Paul/e/B001H9XQJA">Harry Paul</a>, <a href="/John-    Christensen/e/B003VKXJ04">John Christensen</a> and Ken Blanchard</span>
            <span class="binding"> (<span class="format">Hardcover</span> - Mar. 8, 2000)    </span>
           </div> 
我得到空值。尝试提取更高的元素,例如:

Element title = doc.getElementById("div.productData");
我也得到空值。我尝试了许多代码组合,但无法找出从内部div类或内部id提取的语法


任何帮助都将不胜感激。

您正在尝试使用
getElementById()
按ID选择元素。这是错误的。那些div没有ID,而是有一个类名。您应该改用
select()
方法

Element title = doc.select("div.productTitle").first();
请注意,classname选择器不一定返回单个元素。文档中可以有多个。我假设您需要第一个也是唯一的
元素
,因此我在示例中添加了
first()
调用

Element title = doc.select("div.productTitle").first();