Java 使用JSoup从Google Play Store获取应用程序名称
我正试图通过JSoup从Google Play商店获取应用程序的名称 例如,如果我想用作测试用例,我只希望打印出以下内容:Java 使用JSoup从Google Play Store获取应用程序名称,java,html,parsing,web-scraping,jsoup,Java,Html,Parsing,Web Scraping,Jsoup,我正试图通过JSoup从Google Play商店获取应用程序的名称 例如,如果我想用作测试用例,我只希望打印出以下内容: Hill Climb Racing 下面是我用来尝试获取应用程序名称的代码: Document doc = Jsoup.connect(https://play.google.com/store/apps/details?id=com.fingersoft.hillclimb&hl=en).get(); Elements link = doc.select("h1
Hill Climb Racing
下面是我用来尝试获取应用程序名称的代码:
Document doc = Jsoup.connect(https://play.google.com/store/apps/details?id=com.fingersoft.hillclimb&hl=en).get();
Elements link = doc.select("h1.document-title");
System.out.println(link);
下面是我运行它时打印出来的内容:
<h1 class="document-title" itemprop="name">
<div>
Hill Climb Racing
</div> </h1>
爬山比赛
我假设我真的很接近,因为我实际上打印了“爬山比赛”,但还有其他不想要的信息。我不知道如何最好地捕捉标题
我想做一个子字符串并捕获两个字符串之间的内容
<div>
及
但是,由于应用程序具有不同的长度名称,因此每次都必须计算该值,因此子字符串的长度也会不同
如果有人知道一种更好的方法来获取所需的信息(或者如果我在正确的轨道上),我将非常感谢任何帮助
谢谢,
杰克因为
链接
是元素
toString的结果(由println调用的方法
)显示从DOM中选择的元素
如果要查看由这些元素生成的文本,请使用text()
方法
System.out.println(link.text());
// add this---^^^^^^^
System.out.println(link.text());
// add this---^^^^^^^