c#通过html agility pack解析来自wikipedia的数据

c#通过html agility pack解析来自wikipedia的数据,c#,xpath,html-agility-pack,C#,Xpath,Html Agility Pack,我想从link中提取这部电影的发行日期 问题是它直接在标记中给出,该标记没有类或id。我能想到的唯一可能的解决方案是使用样式标记提取数据,但我不知道如何做 这是我的密码 url = "https://en.wikipedia.org/wiki/" + textBox1.Text.Replace(" ", "_"); try { foreach (HtmlNode node in doc.DocumentNode.SelectNodes(/*?*/)) { labe

我想从link中提取这部电影的发行日期

问题是它直接在
标记中给出,该标记没有类或id。我能想到的唯一可能的解决方案是使用样式标记提取数据,但我不知道如何做

这是我的密码

url = "https://en.wikipedia.org/wiki/" + textBox1.Text.Replace(" ", "_");
try
{
    foreach (HtmlNode node in doc.DocumentNode.SelectNodes(/*?*/))
    {
        label1.Text+=node.InnerText;
    }                                
}
catch (Exception ex3) { }

请帮忙

以下XPath表达式为您提供了所需的元素:

//*[@id="mw-content-text"]/div/table[1]/tbody/tr[14]/td
专业提示:打开Chrome调试器工具,导航到要搜索的元素,右键单击并点击“复制>复制xpath”


建议:XPath表达式似乎相当脆弱。有时,尝试使用正则表达式提取HTML的特定部分更有意义,这可能导致更稳定的解决方案。然而,表[1]和tr[14]使用的是索引。在其他wiki页面上,这将不起作用。我认为最好检索整个表,并用文本“releasedate”True检查正确的th元素!正如我所说的,在这一点上,使用正则表达式或只是迭代表行是有意义的?或者因为你想了解电影的信息?老实说,下载wiki页面并手动解析是我最不愿意做的事情。@Manfred Radlwimmer的sorta项目和im只允许使用html agility packIf,你的意思是这是某种学校作业,不管是谁教你,都是在引导你走上一条非常错误的道路。这不是一个学校项目@Manfred RadlwimmerThen谁在阻止你以正确的方式做这件事?html敏捷包有它的用途,熟悉它不会有什么坏处,但它应该是最后的选择。当一个站点提供API、Web服务、RSS或任何类似的东西时,请使用它。