Java web爬虫的正则表达式

Java web爬虫的正则表达式,java,regex,Java,Regex,我正在仔细阅读用java编写的web爬虫程序的代码片段。它使用字符串url=“”启动爬虫和正则表达式“http://(\w+\)*(\w+)”。有人能解释一下它的含义吗 好吧,我们走吧,好吗 文本http://将按字面匹配 (…)表示捕获组 \w表示“单词字符” +表示“前面的一件或多件事” \.表示文字点() *表示之前的内容(捕获组中的所有内容)为零或更多 然后是另一个单词字符的捕获组 请考虑书签,以备将来参考。可能感兴趣的另一个链接是,该链接列在“常见验证任务”下。

我正在仔细阅读用java编写的web爬虫程序的代码片段。它使用字符串url=“”启动爬虫和正则表达式“http://(\w+\)*(\w+)”。有人能解释一下它的含义吗

好吧,我们走吧,好吗

  • 文本
    http://
    将按字面匹配
  • (…)
    表示捕获组
  • \w
    表示“单词字符”
  • +
    表示“前面的一件或多件事”
  • \.
    表示文字点(
  • *
    表示之前的内容(捕获组中的所有内容)为零或更多
  • 然后是另一个单词字符的捕获组

  • 请考虑书签,以备将来参考。可能感兴趣的另一个链接是,该链接列在“常见验证任务”下。