C# 如何从网站的表格中查找和提取信息?
我对C#和特定的HtmlAgilityPack非常陌生,从网站上获取信息时遇到困难。例如,我想从网站的表格中获取图像url: 从网站上,我试图找到并摘录以下内容:C# 如何从网站的表格中查找和提取信息?,c#,web-scraping,nodes,html-agility-pack,C#,Web Scraping,Nodes,Html Agility Pack,我对C#和特定的HtmlAgilityPack非常陌生,从网站上获取信息时遇到困难。例如,我想从网站的表格中获取图像url: 从网站上,我试图找到并摘录以下内容: string s = "http://www.serebii.net/pokedex-rs/005.shtml"; HtmlWeb hw = new HtmlWeb(); HtmlAgilityPack.HtmlDocument doc = hw.Load(s); //HtmlN
string s = "http://www.serebii.net/pokedex-rs/005.shtml";
HtmlWeb hw = new HtmlWeb();
HtmlAgilityPack.HtmlDocument doc = hw.Load(s);
//HtmlNodeCollection items = doc.DocumentNode.SelectNodes("//a[@class='question-hyperlink']");
HtmlNodeCollection items = doc.DocumentNode.SelectNodes("//table//tr//td//div//table//tbody//tr//td//img");
foreach (HtmlNode item in items)
{
Console.WriteLine(item.OuterHtml);
MessageBox.Show(item.OuterHtml);
}
Console.ReadLine();
我敢肯定我已经偏离了目标,任何帮助都将不胜感激。您只能希望开发人员不喜欢经常更新源代码
var item = doc.DocumentNode.SelectSingleNode("//table//tr//tr//td//div//tr//img");
string imageSrc = item.GetAttributeValue("src", "");
Console.WriteLine(imageSrc);
您只能希望开发人员不喜欢经常更新源代码
var item = doc.DocumentNode.SelectSingleNode("//table//tr//tr//td//div//tr//img");
string imageSrc = item.GetAttributeValue("src", "");
Console.WriteLine(imageSrc);
当你说提取时,你到底需要做什么?很明显,这个表只包含图像的路径,所以你只是想获取图像的URL,还是真的下载并在本地保存每个图像的副本?当你说提取时,你到底需要做什么?显然,该表将包含图像的路径,因此您是希望获取图像的URL,还是实际下载并在本地保存每个图像的副本?非常感谢,请问“[0]”代表什么?我对它进行了一些讨论,但我不太理解它。由于有多个图像与该格式匹配,[0]返回数组中的第一项。非常感谢,我可以问一下“[0]”代表什么吗?我对它进行了一些讨论,但我不太理解它。由于有多个图像与该格式匹配,[0]返回数组中的第一项。