Regex 从html页面的许多不同结构中获取链接的最佳正则表达式字符串
我正在解析来自许多不同HTML数据结构的链接,到目前为止,我当前的正则表达式字符串对其中大多数都有效。然而,我遇到过这样一个链接结构的域,我也希望能够抓住它们Regex 从html页面的许多不同结构中获取链接的最佳正则表达式字符串,regex,vb.net,Regex,Vb.net,我正在解析来自许多不同HTML数据结构的链接,到目前为止,我当前的正则表达式字符串对其中大多数都有效。然而,我遇到过这样一个链接结构的域,我也希望能够抓住它们 <a href="http://www.domain.dk/eportal/kontakt.asp"><font face="Verdana" size="2"></font></a> 在锚文本中,但这不起作用,可能是
<a
href="http://www.domain.dk/eportal/kontakt.asp"><font face="Verdana" size="2"></font></a>
在锚文本中,但这不起作用,可能是我做错了?这适用于您提供的示例
/<a.*?href=["']?([^'">\ ]*)["']?[^>]*>.*<\/a>/is
/FYI[hrefHREF]
将只匹配一个字符h、r、e、f、h、r、e
或f
。
/<a.*?href=["']?([^'">\ ]*)["']?[^>]*>.*<\/a>/is