C# 如何从网站的表格中查找和提取信息？_C#_Web Scraping_Nodes_Html Agility Pack

C# 如何从网站的表格中查找和提取信息？

c# web-scraping

C# 如何从网站的表格中查找和提取信息？,c#,web-scraping,nodes,html-agility-pack,C#,Web Scraping,Nodes,Html Agility Pack,我对C#和特定的HtmlAgilityPack非常陌生，从网站上获取信息时遇到困难。例如，我想从网站的表格中获取图像url：从网站上，我试图找到并摘录以下内容： string s = "http://www.serebii.net/pokedex-rs/005.shtml"; HtmlWeb hw = new HtmlWeb(); HtmlAgilityPack.HtmlDocument doc = hw.Load(s); //HtmlN

我对C#和特定的HtmlAgilityPack非常陌生，从网站上获取信息时遇到困难。例如，我想从网站的表格中获取图像url：

从网站上，我试图找到并摘录以下内容：

 string s = "http://www.serebii.net/pokedex-rs/005.shtml";

        HtmlWeb hw = new HtmlWeb();
        HtmlAgilityPack.HtmlDocument doc = hw.Load(s);

        //HtmlNodeCollection items = doc.DocumentNode.SelectNodes("//a[@class='question-hyperlink']");
        HtmlNodeCollection items = doc.DocumentNode.SelectNodes("//table//tr//td//div//table//tbody//tr//td//img");
        foreach (HtmlNode item in items)
        {
            Console.WriteLine(item.OuterHtml);
            MessageBox.Show(item.OuterHtml);
        }

        Console.ReadLine();

我敢肯定我已经偏离了目标，任何帮助都将不胜感激。

您只能希望开发人员不喜欢经常更新源代码

var item = doc.DocumentNode.SelectSingleNode("//table//tr//tr//td//div//tr//img");
string imageSrc = item.GetAttributeValue("src", "");
Console.WriteLine(imageSrc);

您只能希望开发人员不喜欢经常更新源代码

var item = doc.DocumentNode.SelectSingleNode("//table//tr//tr//td//div//tr//img");
string imageSrc = item.GetAttributeValue("src", "");
Console.WriteLine(imageSrc);

当你说提取时，你到底需要做什么？很明显，这个表只包含图像的路径，所以你只是想获取图像的URL，还是真的下载并在本地保存每个图像的副本？当你说提取时，你到底需要做什么？显然，该表将包含图像的路径，因此您是希望获取图像的URL，还是实际下载并在本地保存每个图像的副本？非常感谢，请问“[0]”代表什么？我对它进行了一些讨论，但我不太理解它。由于有多个图像与该格式匹配，[0]返回数组中的第一项。非常感谢，我可以问一下“[0]”代表什么吗？我对它进行了一些讨论，但我不太理解它。由于有多个图像与该格式匹配，[0]返回数组中的第一项。