Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/396.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java Jsoup表解析_Java_Parsing_Jsoup - Fatal编程技术网

Java Jsoup表解析

Java Jsoup表解析,java,parsing,jsoup,Java,Parsing,Jsoup,我是jsoup和这个解析工具的新手,所以如果您需要更多信息来回答我的问题,请告诉我 我想用Java中的Jsoup解析这个表。我只想得到以下文字: “计算机科学学士,CS(2012-2014)” 从桌子的这一部分开始 <h3>Fahran S Kamili (fsk226)</h3> <div> 10 Degree Audit Requests Returned. </div>

我是jsoup和这个解析工具的新手,所以如果您需要更多信息来回答我的问题,请告诉我

我想用Java中的Jsoup解析这个表。我只想得到以下文字:

“计算机科学学士,CS(2012-2014)”

从桌子的这一部分开始

  <h3>Fahran S Kamili (fsk226)</h3>
        <div>
            10 Degree Audit Requests Returned.
        </div>
        <table>
            <thead>
                <tr>
<!-- *nrfkh - 9/2012: [degaudt-634]* -->
                        <th colspan="8">Degree Audits Requested</th>

<!-- *end nrfkh - 9/2012: [degaudt-634]* -->

                </tr>
                <tr>
                    <th>Rerun</th>

<!-- *nrfkh - 9/2012: [degaudt-634]* -->

<!-- *end nrfkh - 9/2012: [degaudt-634]* -->
                    <th>Request Created</th>
<!-- *nrfkh - 9/2012: [degaudt-634]* -->

<!-- *end nrfkh - 9/2012: [degaudt-634]* -->
                    <th>Audit Type</th>
                    <th>Program</th>
                    <th>Courses Requested</th>
                    <th>Request Status</th>
                    <th>Audit ID</th>
                    <th>Delete Option</th>
                </tr>
            </thead>
                    <tbody><tr>
                        <td>
                                    <a href="https://utdirect.utexas.edu/apps/degree/audits/requests/student_individual/?form-0-eid=fsk226&form-0-name=Fahran%20S%20Kamili&form-0-begin_ccyy=2012&form-0-degree_plan=ESC%20SS%20CS&form-0-minor=&current=X&future=&planned=&form-TOTAL_FORMS=20&form-INITIAL_FORMS=0&form-MAX_NUM_FORMS=&rerun=" target="_blank">Rerun</a>
                        </td>
<!-- *nrfkh - 9/2012: [degaudt-634]* -->
<!-- *end nrfkh - 9/2012: [degaudt-634]* -->
                        <td>
                            12/20/2013
                            05:06 PM
                        </td>
<!-- *nrfkh - 9/2012: [degaudt-634]* -->
<!-- *end nrfkh - 9/2012: [degaudt-634]* -->
                        <td>
                                Normal

                        </td>
                        <td>
                            B S Computer Science, CS
                            (2012-2014)
                        </td>
法赫兰S卡米利(fsk226) 返回10度审核请求。 要求进行学位审核 重播 创建的请求 审计类型 节目 要求的课程 请求状态 审计ID 删除选项 12/20/2013 下午五时零六分 正常的 计算机科学学士 (2012-2014)
表实际上是向下延伸的,但是包含的内容彼此只是兄弟(因此我假设如果我可以得到这个文本,我也可以很容易地得到其他文本)。

如果我将你的
HTML
部分保存到一个文件中,并通过
jsoup
解析它,我会尝试打印遇到的所有
td
元素,因为这就是您所追求的:

public static void main(String... args) throws IOException {
        File input = new File("C:/users/XYZ/desktop/input.html");
        Document doc = Jsoup.parse(input, "UTF-8", "");
        Elements tds = doc.getElementsByTag("td");
        for (Element td : tds) {
            System.out.println(td.text());
        }
    }
输出:

Rerun
12/20/2013 05:06 PM
Normal
B S Computer Science, CS (2012-2014)
“如果您需要更多信息……”
——是的,比如您到目前为止尝试了什么,它是如何不起作用的?还有什么让你特别困惑?