C# 获取锚定标记HREF和值
我有一个字符串如下所示:C# 获取锚定标记HREF和值,c#,regex,string,parsing,find,C#,Regex,String,Parsing,Find,我有一个字符串如下所示: <a href="http://forum.tibia.com/forum/?action=board&boardid=476">Amera</a><br><font class="ff_info">This board is for general discussions related to the game world Amera.</font> 但它的回报是: Amera</a>&
<a href="http://forum.tibia.com/forum/?action=board&boardid=476">Amera</a><br><font class="ff_info">This board is for general discussions related to the game world Amera.</font>
但它的回报是:
Amera</a><br><font class="ff_info">This board is for general discussions related to the game world Amera.</font>
Amera
此板块用于与游戏世界Amera相关的一般性讨论。
要获取URL,可以尝试以下正则表达式模式:/href=\“(.*)\”/
…并获取Amera之间的值
使用如下模式:>(.+?)
…虽然,这似乎远远不够完美…如果
a
标记不包含更多属性,您可以仅将其用于URL:
\bhref="(.*?)"
URL和文本稍微复杂一些:
<a\b[^>]*?\bhref="([^"]*?)"[^>]*?>(.*?)<\/a>
此板用于与游戏世界Amera相关的一般性讨论。“;
var match=Regex.match(html,“]*?\\bhref=\”([^\“]*?)\“[^>]*?>(.*?”,RegexOptions.IgnoreCase);
如果(匹配成功){
var url=match.Groups[1];
var text=match.Groups[2]
}
试试这个:
HtmlDocument dc = new HtmlAgilityPack.HtmlDocument();
dc.LoadHtml("<a href='http://forum.tibia.com/forum/?action=board&boardid=476'>Amera</a><br><font class='ff_info'>This board is for general discussions related to the game world Amera.</font>");
foreach (HtmlNode link in dc.DocumentNode.SelectNodes("a"))
{
string url = link.Attributes["href"].Value; // http://forum.tibia.com/forum/?action=board&boardid=476
string value = link.InnerText; // Amera
}
HtmlDocument dc=new-HtmlAgilityPack.HtmlDocument();
LoadHtml(
此板用于与游戏世界Amera相关的一般性讨论);
foreach(dc.DocumentNode.SelectNodes(“a”)中的HtmlNode链接)
{
字符串url=link.Attributes[“href”].Value;//http://forum.tibia.com/forum/?action=board&boardid=476
字符串值=link.InnerText;//Amera
}
url工作得很好。但是我怎样才能得到a标签中的文本呢?(值)@rickastley抱歉,我忘了文本-用一个新的正则表达式更新了帖子,该正则表达式适用于url和文本。
HtmlDocument dc = new HtmlAgilityPack.HtmlDocument();
dc.LoadHtml("<a href='http://forum.tibia.com/forum/?action=board&boardid=476'>Amera</a><br><font class='ff_info'>This board is for general discussions related to the game world Amera.</font>");
foreach (HtmlNode link in dc.DocumentNode.SelectNodes("a"))
{
string url = link.Attributes["href"].Value; // http://forum.tibia.com/forum/?action=board&boardid=476
string value = link.InnerText; // Amera
}