c#通过html agility pack解析来自wikipedia的数据_C#_Xpath_Html Agility Pack

c#通过html agility pack解析来自wikipedia的数据

c# xpath

c#通过html agility pack解析来自wikipedia的数据,c#,xpath,html-agility-pack,C#,Xpath,Html Agility Pack,我想从link中提取这部电影的发行日期问题是它直接在标记中给出，该标记没有类或id。我能想到的唯一可能的解决方案是使用样式标记提取数据，但我不知道如何做这是我的密码 url = "https://en.wikipedia.org/wiki/" + textBox1.Text.Replace(" ", "_"); try { foreach (HtmlNode node in doc.DocumentNode.SelectNodes(/*?*/)) { labe

我想从link中提取这部电影的发行日期

问题是它直接在

标记中给出，该标记没有类或id。我能想到的唯一可能的解决方案是使用样式标记提取数据，但我不知道如何做

这是我的密码

url = "https://en.wikipedia.org/wiki/" + textBox1.Text.Replace(" ", "_");
try
{
    foreach (HtmlNode node in doc.DocumentNode.SelectNodes(/*?*/))
    {
        label1.Text+=node.InnerText;
    }                                
}
catch (Exception ex3) { }

请帮忙

以下XPath表达式为您提供了所需的元素：

//*[@id="mw-content-text"]/div/table[1]/tbody/tr[14]/td

专业提示：打开Chrome调试器工具，导航到要搜索的元素，右键单击并点击“复制>复制xpath”

建议：XPath表达式似乎相当脆弱。有时，尝试使用正则表达式提取HTML的特定部分更有意义，这可能导致更稳定的解决方案。然而，表[1]和tr[14]使用的是索引。在其他wiki页面上，这将不起作用。我认为最好检索整个表，并用文本“releasedate”True检查正确的th元素！正如我所说的，在这一点上，使用正则表达式或只是迭代表行是有意义的？或者因为你想了解电影的信息？老实说，下载wiki页面并手动解析是我最不愿意做的事情。@Manfred Radlwimmer的sorta项目和im只允许使用html agility packIf，你的意思是这是某种学校作业，不管是谁教你，都是在引导你走上一条非常错误的道路。这不是一个学校项目@Manfred RadlwimmerThen谁在阻止你以正确的方式做这件事？html敏捷包有它的用途，熟悉它不会有什么坏处，但它应该是最后的选择。当一个站点提供API、Web服务、RSS或任何类似的东西时，请使用它。