Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/html/88.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 使用jsoup解析html表_Java_Html_Parsing_Web Scraping_Jsoup - Fatal编程技术网

Java 使用jsoup解析html表

Java 使用jsoup解析html表,java,html,parsing,web-scraping,jsoup,Java,Html,Parsing,Web Scraping,Jsoup,我正在尝试使用jsoup解析HTML表。我是jsoup的新手,我读过一些关于它的教程。我需要为此网站的每列从表中提取值:。我试着获取每个时间戳,但它只打印了一个元素。这是我上次尝试的代码 Document doc = Jsoup.connect("https://www.basketball-reference.com/boxscores/pbp/201905160GSW.html").get(); Elements trs = doc.select("table"); fo

我正在尝试使用jsoup解析HTML表。我是jsoup的新手,我读过一些关于它的教程。我需要为此网站的每列从表中提取值:。我试着获取每个时间戳,但它只打印了一个元素。这是我上次尝试的代码

Document doc = Jsoup.connect("https://www.basketball-reference.com/boxscores/pbp/201905160GSW.html").get();         
Elements trs = doc.select("table");

for(Element tr : trs) {
    Elements tds = tr.getElementsByTag("td");
    Element td = tds.get(0);
    System.out.println(td.text());
}

你明白你的代码吗

它选择所有表并将它们放入
trs
变量:

Elements trs=doc.select(“表”)

然后迭代每个表:

for(元素tr:trs){

从每个表中选择所有单元格“td”:

Elements-tds=tr.getElementsByTag(“td”);

然后只需要第一个单元格

Element td=tds.get(0);

并打印其内容

System.out.println(td.text());


其中一些操作是不必要的,但是现在有了这些解释,您应该有了一个良好的开端。

您理解您的代码吗

它选择所有表并将它们放入
trs
变量:

Elements trs=doc.select(“表”);

然后迭代每个表:

for(元素tr:trs){

从每个表中选择所有单元格“td”:

Elements-tds=tr.getElementsByTag(“td”);

然后只需要第一个单元格

Element td=tds.get(0);

并打印其内容

System.out.println(td.text());


其中一些操作是不必要的,但是现在有了这个解释,您应该有了一个好的开始。

感谢您的解释。但是我尝试使用doc.select(“table tr”)迭代每一行,它对其他一些表有效,但对这个表无效。我不太擅长html,所以我不知道如何迭代每一行。感谢您的解释。但我尝试使用doc.select(“table tr”)迭代每一行,它对其他一些表有效,但对这个表无效。我不太擅长html,所以我不知道如何迭代每一行。