Asp.net 如何提取网页的标题图像

Asp.net 如何提取网页的标题图像,asp.net,html,regex,page-title,asp.net-webpages,Asp.net,Html,Regex,Page Title,Asp.net Webpages,我想在ASP.NET中使用C#提取网页的标题图像。我检查了窗口和文档对象,但它们没有诸如title之类的属性。因此,在Chrome的页面选项卡中搜索提取标题图像的方法 using (WebClient client = new WebClient()) { Byte[] favico = client.DownloadData("http://msite.com/favico.ico"); } 那是在使用。如果您希望存储它,也可以使用 另一种防弹方法是下载索引页面,并使用HTML解析器查找

我想在ASP.NET中使用C#提取网页的标题图像。我检查了窗口和文档对象,但它们没有诸如title之类的属性。因此,在Chrome的页面选项卡中搜索提取标题图像的方法

using (WebClient client = new WebClient())
{
  Byte[] favico = client.DownloadData("http://msite.com/favico.ico");
}
那是在使用。如果您希望存储它,也可以使用

另一种防弹方法是下载索引页面,并使用HTML解析器查找指定图标位置的
标记(也可以应用于apple touch图标或其他)

顺便说一句,我相信您希望解析的标记是:

<!-- StackOverflow's implementation: -->
<link rel="shortcut icon" href="http://cdn.../favicon.ico">
<link rel="apple-touch-icon" href="http://cdn.../apple-touch-icon.png">

<!-- Google's implementation: -->
<meta content="/images/google_favicon_128.png" itemprop="image">

<!-- Facebook's implementation: -->
<link href="http://static.ak.fbcdn.net/.../q9U99v3_saj.ico" rel="shortcut icon">

那是在使用。如果您希望存储它,也可以使用

另一种防弹方法是下载索引页面,并使用HTML解析器查找指定图标位置的
标记(也可以应用于apple touch图标或其他)

顺便说一句,我相信您希望解析的标记是:

<!-- StackOverflow's implementation: -->
<link rel="shortcut icon" href="http://cdn.../favicon.ico">
<link rel="apple-touch-icon" href="http://cdn.../apple-touch-icon.png">

<!-- Google's implementation: -->
<meta content="/images/google_favicon_128.png" itemprop="image">

<!-- Facebook's implementation: -->
<link href="http://static.ak.fbcdn.net/.../q9U99v3_saj.ico" rel="shortcut icon">

HTML规范中没有“标题图像”这样的东西。在某些浏览器中,您在选项卡中或URL附近看到的图标是使用
构造指定的:

<link type="image/x-icon" href="/images/favicon.ico" rel="icon" />

IE可能要求您使用稍微不同的语法:

<link type="image/x-icon" href="/images/favicon.ico" rel="shortcut" />

解析页面-并检索
href
属性的值-这是图标的路径


另外请注意,IE版本8及以下版本完全忽略这一行,而是在站点根目录中查找文件
favicon.ico
。有关IE的更多信息,请参阅。

HTML规范中没有“标题图像”这样的东西。在某些浏览器中,您在选项卡中或URL附近看到的图标是使用
构造指定的:

<link type="image/x-icon" href="/images/favicon.ico" rel="icon" />

IE可能要求您使用稍微不同的语法:

<link type="image/x-icon" href="/images/favicon.ico" rel="shortcut" />

解析页面-并检索
href
属性的值-这是图标的路径


另外请注意,IE版本8及以下版本完全忽略这一行,而是在站点根目录中查找文件
favicon.ico
。有关IE的更多信息,请参阅。

您的问题不清楚。您是否试图通过解析
aspx
页面从控制台或winforms应用程序获取此信息?您是否正在编写asp.net应用程序,只是想通过编程方式获取/设置标题?如果是后者,您应该查看
Page.Title
您所说的“Title”图像是什么意思?你是说HTML没有“标题图像”吗。你到底是什么意思?我相信他想要faviconYep,Chrome标签上存储的图像源是favicon。你的问题不清楚。您是否试图通过解析
aspx
页面从控制台或winforms应用程序获取此信息?您是否正在编写asp.net应用程序,只是想通过编程方式获取/设置标题?如果是后者,您应该查看
Page.Title
您所说的“Title”图像是什么意思?你是说HTML没有“标题图像”吗。你到底是什么意思?我相信他想要faviconYep,存储在Chrome标签上的图像源是favicon。请注意,这并不总是正确的。只有版本8之前的IE才会自动在站点的根目录中查找图标。所有其他浏览器以及IE9都会在文档中查找
标记。路径可以是您喜欢的任何东西,也不一定是根。@AleksG:因此,我在第二段中补充了一个更健壮的解决方案,但感谢后续的详细信息。对于解析,我想使用正则表达式?@user1575229:我建议不要使用它;最好使用DOM/HTML解析器。或者您可以在ASP中实例化并使用其解析器(尽管我不确定这是否理想,因为它是一个ASP应用程序,而WebBrowser是一个WinForms类。考虑到WebBrower控件的用途,您还将获得大量不必要的开销——仅用于DOM解析就需要加载很多)喜欢打字:
StockOverflow
:)注意,这并不总是正确的。只有版本8之前的IE才会自动在站点的根目录中查找图标。所有其他浏览器以及IE9都会在文档中查找
标记。路径可以是您喜欢的任何东西,也不一定是根。@AleksG:因此,我在第二段中补充了一个更健壮的解决方案,但感谢后续的详细信息。对于解析,我想使用正则表达式?@user1575229:我建议不要使用它;最好使用DOM/HTML解析器。或者您可以在ASP中实例化并使用其解析器(尽管我不确定这是否理想,因为它是一个ASP应用程序,而WebBrowser是一个WinForms类。考虑到WebBrowser控件的用途,您还将获得大量不必要的开销——仅用于DOM解析就需要加载很多)。喜欢输入错误:
StockOverflow
:)