Java web爬虫的正则表达式
我正在仔细阅读用java编写的web爬虫程序的代码片段。它使用字符串url=“”启动爬虫和正则表达式“http://(\w+\)*(\w+)”。有人能解释一下它的含义吗 好吧,我们走吧,好吗Java web爬虫的正则表达式,java,regex,Java,Regex,我正在仔细阅读用java编写的web爬虫程序的代码片段。它使用字符串url=“”启动爬虫和正则表达式“http://(\w+\)*(\w+)”。有人能解释一下它的含义吗 好吧,我们走吧,好吗 文本http://将按字面匹配 (…)表示捕获组 \w表示“单词字符” +表示“前面的一件或多件事” \.表示文字点() *表示之前的内容(捕获组中的所有内容)为零或更多 然后是另一个单词字符的捕获组 请考虑书签,以备将来参考。可能感兴趣的另一个链接是,该链接列在“常见验证任务”下。
- 文本
将按字面匹配http://
表示捕获组(…)
表示“单词字符”\w
表示“前面的一件或多件事”+
表示文字点(\.
)
表示之前的内容(捕获组中的所有内容)为零或更多*
- 然后是另一个单词字符的捕获组
请考虑书签,以备将来参考。可能感兴趣的另一个链接是,该链接列在“常见验证任务”下。