C# 在C中查找HTML的XPath内容#

C# 在C中查找HTML的XPath内容#,c#,xpath,web-scraping,html-parsing,C#,Xpath,Web Scraping,Html Parsing,我在C#net核心工作 我有HTML文件 对于每个文件,我都有一个指向部分页面的XPATH 我可以在C#中使用哪个库/nuget包来提取数据 我想: extractedData = xpathLib.Extract(htmlContent, xpath) 我不想使用加载html浏览器进程的技术(比如selenium驱动程序打开chrome),因为我每天要提取10000个网页 问候。 ps:我看到microsoft提供了xpath库,但它只针对xml。您可以使用 此nuget可与XPATH、

我在C#net核心工作

  • 我有HTML文件
  • 对于每个文件,我都有一个指向部分页面的XPATH
我可以在C#中使用哪个库/nuget包来提取数据

我想:

extractedData = xpathLib.Extract(htmlContent, xpath)
我不想使用加载html浏览器进程的技术(比如selenium驱动程序打开chrome),因为我每天要提取10000个网页

问候。 ps:我看到microsoft提供了xpath库,但它只针对xml。

您可以使用

此nuget可与XPATH、XDocument和LINQ一起使用。而且使用方便

以下是一个例子:


谢谢你,你在项目中用过吗?你觉得怎么样?是的,我觉得。我过去常常从一页上获取书籍的详细信息。我不明白你的第二个问题。
var url = "http://html-agility-pack.net/";
var web = new HtmlWeb();
var doc = web.Load(url);
var value = doc.DocumentNode.SelectNodes("//td/input");