C# 如何从网站的表格中查找和提取信息?

C# 如何从网站的表格中查找和提取信息?,c#,web-scraping,nodes,html-agility-pack,C#,Web Scraping,Nodes,Html Agility Pack,我对C#和特定的HtmlAgilityPack非常陌生,从网站上获取信息时遇到困难。例如,我想从网站的表格中获取图像url: 从网站上,我试图找到并摘录以下内容: string s = "http://www.serebii.net/pokedex-rs/005.shtml"; HtmlWeb hw = new HtmlWeb(); HtmlAgilityPack.HtmlDocument doc = hw.Load(s); //HtmlN

我对C#和特定的HtmlAgilityPack非常陌生,从网站上获取信息时遇到困难。例如,我想从网站的表格中获取图像url:

从网站上,我试图找到并摘录以下内容:

 string s = "http://www.serebii.net/pokedex-rs/005.shtml";

        HtmlWeb hw = new HtmlWeb();
        HtmlAgilityPack.HtmlDocument doc = hw.Load(s);

        //HtmlNodeCollection items = doc.DocumentNode.SelectNodes("//a[@class='question-hyperlink']");
        HtmlNodeCollection items = doc.DocumentNode.SelectNodes("//table//tr//td//div//table//tbody//tr//td//img");
        foreach (HtmlNode item in items)
        {
            Console.WriteLine(item.OuterHtml);
            MessageBox.Show(item.OuterHtml);
        }

        Console.ReadLine();


我敢肯定我已经偏离了目标,任何帮助都将不胜感激。

您只能希望开发人员不喜欢经常更新源代码

var item = doc.DocumentNode.SelectSingleNode("//table//tr//tr//td//div//tr//img");
string imageSrc = item.GetAttributeValue("src", "");
Console.WriteLine(imageSrc);

您只能希望开发人员不喜欢经常更新源代码

var item = doc.DocumentNode.SelectSingleNode("//table//tr//tr//td//div//tr//img");
string imageSrc = item.GetAttributeValue("src", "");
Console.WriteLine(imageSrc);

当你说提取时,你到底需要做什么?很明显,这个表只包含图像的路径,所以你只是想获取图像的URL,还是真的下载并在本地保存每个图像的副本?当你说提取时,你到底需要做什么?显然,该表将包含图像的路径,因此您是希望获取图像的URL,还是实际下载并在本地保存每个图像的副本?非常感谢,请问“[0]”代表什么?我对它进行了一些讨论,但我不太理解它。由于有多个图像与该格式匹配,[0]返回数组中的第一项。非常感谢,我可以问一下“[0]”代表什么吗?我对它进行了一些讨论,但我不太理解它。由于有多个图像与该格式匹配,[0]返回数组中的第一项。