Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/341.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/svg/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
扫描和显示网站中的每个单词源代码Java_Java_Parsing_Delimiter - Fatal编程技术网

扫描和显示网站中的每个单词源代码Java

扫描和显示网站中的每个单词源代码Java,java,parsing,delimiter,Java,Parsing,Delimiter,我的任务是扫描网站源代码的内容,并使用分隔符从网站中提取所有超链接并显示它们。在网上浏览了一番之后,我得到了以下信息: import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.net.MalformedURLException; import java.net.URL; import java.util.Scanner; pu

我的任务是扫描网站源代码的内容,并使用分隔符从网站中提取所有超链接并显示它们。在网上浏览了一番之后,我得到了以下信息:

    import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.MalformedURLException;
import java.net.URL;
import java.util.Scanner;

    public class HyperlinkMain {
public static void main(String[] args) {
    try {
        Scanner in = new Scanner (System.in);
        String URL = in.next();

        URL website = new URL(URL);
        BufferedReader input = new BufferedReader(new InputStreamReader(website.openStream()));
        String inputLine; 

        while ((inputLine = input.readLine()) != null) {
            // Process each line.
            System.out.println(inputLine);
        }
        in.close(); 

    } catch (MalformedURLException me) {
        System.out.println(me); 

    } catch (IOException ioe) {
        System.out.println(ioe);
    }
}
}


所以我的程序可以从网站的源代码中提取每一行并显示出来,但实际上我希望它能从源代码中提取每一个单词,而不是每一行。我真的不知道它是怎么做到的,因为我在使用
input.read()时不断出错

检索网页有很多源代码。查看该类以了解如何为超链接正则化文本。通过从网页下载中分别提取超链接,您可以将家庭作业视为两个独立的问题。

将任务分成两个问题是一个非常好的建议。@Gus NP,分解问题是编程的重要内容,而不是调试。一个小小的提示,可以找到一个单词或模式的多个实例,这让生活变得更加简单。我看到了两个不同的要求:“提取所有超链接”或“提取所有单词”。你想完成这两个任务中的哪一个?我必须提取所有超链接,但要做到这一点,我认为我应该提取所有单词,然后搜索包含这些单词的单词“etcI认为您不需要先提取所有单词。只需将整个文件拖成一个字符串,然后查找与你最喜欢的超链接正则表达式匹配的所有内容。如果我没有警告你,那我就是失职了。