Warning: file_get_contents(/data/phpspider/zhask/data//catemap/5/objective-c/25.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 使用JSoup从Google Play Store获取应用程序名称_Java_Html_Parsing_Web Scraping_Jsoup - Fatal编程技术网

Java 使用JSoup从Google Play Store获取应用程序名称

Java 使用JSoup从Google Play Store获取应用程序名称,java,html,parsing,web-scraping,jsoup,Java,Html,Parsing,Web Scraping,Jsoup,我正试图通过JSoup从Google Play商店获取应用程序的名称 例如,如果我想用作测试用例,我只希望打印出以下内容: Hill Climb Racing 下面是我用来尝试获取应用程序名称的代码: Document doc = Jsoup.connect(https://play.google.com/store/apps/details?id=com.fingersoft.hillclimb&hl=en).get(); Elements link = doc.select("h1

我正试图通过JSoup从Google Play商店获取应用程序的名称

例如,如果我想用作测试用例,我只希望打印出以下内容:

Hill Climb Racing
下面是我用来尝试获取应用程序名称的代码:

Document doc = Jsoup.connect(https://play.google.com/store/apps/details?id=com.fingersoft.hillclimb&hl=en).get();
Elements link = doc.select("h1.document-title");
System.out.println(link);
下面是我运行它时打印出来的内容:

<h1 class="document-title" itemprop="name"> 
 <div>
  Hill Climb Racing
 </div> </h1>

爬山比赛
我假设我真的很接近,因为我实际上打印了“爬山比赛”,但还有其他不想要的信息。我不知道如何最好地捕捉标题

我想做一个子字符串并捕获两个字符串之间的内容

<div> 


但是,由于应用程序具有不同的长度名称,因此每次都必须计算该值,因此子字符串的长度也会不同

如果有人知道一种更好的方法来获取所需的信息(或者如果我在正确的轨道上),我将非常感谢任何帮助

谢谢,
杰克

因为
链接
元素
toString的结果(由
println调用的方法
)显示从DOM中选择的元素

如果要查看由这些元素生成的文本,请使用
text()
方法

System.out.println(link.text()); 
//          add this---^^^^^^^ 
System.out.println(link.text()); 
//          add this---^^^^^^^