Java 如何从url编辑代码并保存到桌面上的.html文件

Java 如何从url编辑代码并保存到桌面上的.html文件,java,html,edit,Java,Html,Edit,老师让我编写java来读取学校网站上的html文件,并剪切所有不需要的部分(网页中不需要的所有内容),只在网站中心保留公告部分,并另存为另一个html文件 我现在可以将html文件读入java,但不能编写代码进行编辑(不需要的剪切)和另存为html文件 到目前为止已经完成的代码是: import java.io.*; import java.net.*; public class Html { public static void main(String[] args) throws

老师让我编写java来读取学校网站上的html文件,并剪切所有不需要的部分(网页中不需要的所有内容),只在网站中心保留公告部分,并另存为另一个html文件

我现在可以将html文件读入java,但不能编写代码进行编辑(不需要的剪切)和另存为html文件

到目前为止已经完成的代码是:

import java.io.*;
import java.net.*;

public class Html {

    public static void main(String[] args) throws IOException {

            URL chula = new URL("http://www.ise.eng.chula.ac.th");
            URLConnection yc = chula.openConnection();
            BufferedReader in = new BufferedReader(new InputStreamReader(yc
                    .getInputStream()));

            String inputLine;
            while ((inputLine = in.readLine()) != null) {
                System.out.println(inputLine);
            }
            in.close();
        } 
    }
}
更改系统.out.println(输入行);致:

这将创建一个新文件,将输入行的所有内容键入新文件中

我已经编辑了你输入的代码,我想我找到了你需要的答案

您需要做的是使用带有InputStreamReader的扫描仪。扫描仪将读取文件,或者在本例中,读取您正在使用的URL。然后必须使用PrintWriter类创建新文件,并将while循环更改为:

    while(in.hasNext()) {}
这将读取您想要的URL,它将遍历文件(URL)的每一行,直到到达末尾才会停止。然后必须在while循环中创建一个字符串,其中包含来自URl的信息。最后要做的是将内容写入文件,并始终确保关闭扫描仪和要写入的文件

代码如下:

    import java.io.*;
    import java.net.*;
    import java.util.*;

public class Html {
    public static void main(String[] args) throws IOException {

        URL chula = new URL("http://www.ise.eng.chula.ac.th");
        URLConnection yc = chula.openConnection();
        //BufferedReader in = new BufferedReader(new InputStreamReader(yc
          //      .getInputStream()));
        Scanner in = new Scanner(new InputStreamReader(yc.getInputStream()));

        PrintWriter output = new PrintWriter("newFile.html");
        while (in.hasNext()) {
            String inputLine = in.nextLine();
            output.println(inputLine);
        }
        in.close();
        output.close();
    } 
}

希望这有帮助

“剪切不需要的路径”是什么意思?能否粘贴控制台输出?所以我们可以知道你的页面html是怎样的。System.out.println在while循环中-你注意到了吗?尝试过了,但该文件中没有数据。它只是创建了一个空文件。你把output.println(inputLine)放在while循环中了吗?在while循环的内部和外部
    import java.io.*;
    import java.net.*;
    import java.util.*;

public class Html {
    public static void main(String[] args) throws IOException {

        URL chula = new URL("http://www.ise.eng.chula.ac.th");
        URLConnection yc = chula.openConnection();
        //BufferedReader in = new BufferedReader(new InputStreamReader(yc
          //      .getInputStream()));
        Scanner in = new Scanner(new InputStreamReader(yc.getInputStream()));

        PrintWriter output = new PrintWriter("newFile.html");
        while (in.hasNext()) {
            String inputLine = in.nextLine();
            output.println(inputLine);
        }
        in.close();
        output.close();
    } 
}