C# 在C中查找HTML的XPath内容#
我在C#net核心工作C# 在C中查找HTML的XPath内容#,c#,xpath,web-scraping,html-parsing,C#,Xpath,Web Scraping,Html Parsing,我在C#net核心工作 我有HTML文件 对于每个文件,我都有一个指向部分页面的XPATH 我可以在C#中使用哪个库/nuget包来提取数据 我想: extractedData = xpathLib.Extract(htmlContent, xpath) 我不想使用加载html浏览器进程的技术(比如selenium驱动程序打开chrome),因为我每天要提取10000个网页 问候。 ps:我看到microsoft提供了xpath库,但它只针对xml。您可以使用 此nuget可与XPATH、
- 我有HTML文件
- 对于每个文件,我都有一个指向部分页面的XPATH
extractedData = xpathLib.Extract(htmlContent, xpath)
我不想使用加载html浏览器进程的技术(比如selenium驱动程序打开chrome),因为我每天要提取10000个网页
问候。
ps:我看到microsoft提供了xpath库,但它只针对xml。您可以使用
此nuget可与XPATH、XDocument和LINQ一起使用。而且使用方便
以下是一个例子:
谢谢你,你在项目中用过吗?你觉得怎么样?是的,我觉得。我过去常常从一页上获取书籍的详细信息。我不明白你的第二个问题。
var url = "http://html-agility-pack.net/";
var web = new HtmlWeb();
var doc = web.Load(url);
var value = doc.DocumentNode.SelectNodes("//td/input");