Java 使用jsoup解析html表
我正在尝试使用jsoup解析HTML表。我是jsoup的新手,我读过一些关于它的教程。我需要为此网站的每列从表中提取值:。我试着获取每个时间戳,但它只打印了一个元素。这是我上次尝试的代码Java 使用jsoup解析html表,java,html,parsing,web-scraping,jsoup,Java,Html,Parsing,Web Scraping,Jsoup,我正在尝试使用jsoup解析HTML表。我是jsoup的新手,我读过一些关于它的教程。我需要为此网站的每列从表中提取值:。我试着获取每个时间戳,但它只打印了一个元素。这是我上次尝试的代码 Document doc = Jsoup.connect("https://www.basketball-reference.com/boxscores/pbp/201905160GSW.html").get(); Elements trs = doc.select("table"); fo
Document doc = Jsoup.connect("https://www.basketball-reference.com/boxscores/pbp/201905160GSW.html").get();
Elements trs = doc.select("table");
for(Element tr : trs) {
Elements tds = tr.getElementsByTag("td");
Element td = tds.get(0);
System.out.println(td.text());
}
你明白你的代码吗 它选择所有表并将它们放入
trs
变量:
Elements trs=doc.select(“表”)代码>
然后迭代每个表:
for(元素tr:trs){
从每个表中选择所有单元格“td”:
Elements-tds=tr.getElementsByTag(“td”);
然后只需要第一个单元格
Element td=tds.get(0);
并打印其内容
System.out.println(td.text());
其中一些操作是不必要的,但是现在有了这些解释,您应该有了一个良好的开端。您理解您的代码吗
它选择所有表并将它们放入trs
变量:
Elements trs=doc.select(“表”);
然后迭代每个表:
for(元素tr:trs){
从每个表中选择所有单元格“td”:
Elements-tds=tr.getElementsByTag(“td”);
然后只需要第一个单元格
Element td=tds.get(0);
并打印其内容
System.out.println(td.text());
其中一些操作是不必要的,但是现在有了这个解释,您应该有了一个好的开始。感谢您的解释。但是我尝试使用doc.select(“table tr”)迭代每一行,它对其他一些表有效,但对这个表无效。我不太擅长html,所以我不知道如何迭代每一行。感谢您的解释。但我尝试使用doc.select(“table tr”)迭代每一行,它对其他一些表有效,但对这个表无效。我不太擅长html,所以我不知道如何迭代每一行。