扫描和显示网站中的每个单词源代码Java
我的任务是扫描网站源代码的内容,并使用分隔符从网站中提取所有超链接并显示它们。在网上浏览了一番之后,我得到了以下信息:扫描和显示网站中的每个单词源代码Java,java,parsing,delimiter,Java,Parsing,Delimiter,我的任务是扫描网站源代码的内容,并使用分隔符从网站中提取所有超链接并显示它们。在网上浏览了一番之后,我得到了以下信息: import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.net.MalformedURLException; import java.net.URL; import java.util.Scanner; pu
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.MalformedURLException;
import java.net.URL;
import java.util.Scanner;
public class HyperlinkMain {
public static void main(String[] args) {
try {
Scanner in = new Scanner (System.in);
String URL = in.next();
URL website = new URL(URL);
BufferedReader input = new BufferedReader(new InputStreamReader(website.openStream()));
String inputLine;
while ((inputLine = input.readLine()) != null) {
// Process each line.
System.out.println(inputLine);
}
in.close();
} catch (MalformedURLException me) {
System.out.println(me);
} catch (IOException ioe) {
System.out.println(ioe);
}
}
}
所以我的程序可以从网站的源代码中提取每一行并显示出来,但实际上我希望它能从源代码中提取每一个单词,而不是每一行。我真的不知道它是怎么做到的,因为我在使用
input.read()时不断出错代码>检索网页有很多源代码。查看该类以了解如何为超链接正则化文本。通过从网页下载中分别提取超链接,您可以将家庭作业视为两个独立的问题。将任务分成两个问题是一个非常好的建议。@Gus NP,分解问题是编程的重要内容,而不是调试。一个小小的提示,可以找到一个单词或模式的多个实例,这让生活变得更加简单。我看到了两个不同的要求:“提取所有超链接”或“提取所有单词”。你想完成这两个任务中的哪一个?我必须提取所有超链接,但要做到这一点,我认为我应该提取所有单词,然后搜索包含这些单词的单词“etcI认为您不需要先提取所有单词。只需将整个文件拖成一个字符串,然后查找与你最喜欢的超链接正则表达式匹配的所有内容。如果我没有警告你,那我就是失职了。