扫描和显示网站中的每个单词源代码Java_Java_Parsing_Delimiter

扫描和显示网站中的每个单词源代码Java

java parsing

扫描和显示网站中的每个单词源代码Java,java,parsing,delimiter,Java,Parsing,Delimiter,我的任务是扫描网站源代码的内容，并使用分隔符从网站中提取所有超链接并显示它们。在网上浏览了一番之后，我得到了以下信息： import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.net.MalformedURLException; import java.net.URL; import java.util.Scanner; pu

我的任务是扫描网站源代码的内容，并使用分隔符从网站中提取所有超链接并显示它们。在网上浏览了一番之后，我得到了以下信息：

    import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.MalformedURLException;
import java.net.URL;
import java.util.Scanner;

    public class HyperlinkMain {
public static void main(String[] args) {
    try {
        Scanner in = new Scanner (System.in);
        String URL = in.next();

        URL website = new URL(URL);
        BufferedReader input = new BufferedReader(new InputStreamReader(website.openStream()));
        String inputLine; 

        while ((inputLine = input.readLine()) != null) {
            // Process each line.
            System.out.println(inputLine);
        }
        in.close(); 

    } catch (MalformedURLException me) {
        System.out.println(me); 

    } catch (IOException ioe) {
        System.out.println(ioe);
    }
}

}

所以我的程序可以从网站的源代码中提取每一行并显示出来，但实际上我希望它能从源代码中提取每一个单词，而不是每一行。我真的不知道它是怎么做到的，因为我在使用

input.read（）时不断出错
检索网页有很多源代码。查看该类以了解如何为超链接正则化文本。通过从网页下载中分别提取超链接，您可以将家庭作业视为两个独立的问题。
将任务分成两个问题是一个非常好的建议。@Gus NP，分解问题是编程的重要内容，而不是调试。一个小小的提示，可以找到一个单词或模式的多个实例，这让生活变得更加简单。我看到了两个不同的要求：“提取所有超链接”或“提取所有单词”。你想完成这两个任务中的哪一个？我必须提取所有超链接，但要做到这一点，我认为我应该提取所有单词，然后搜索包含这些单词的单词“etcI认为您不需要先提取所有单词。只需将整个文件拖成一个字符串，然后查找与你最喜欢的超链接正则表达式匹配的所有内容。如果我没有警告你，那我就是失职了。