Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/csharp/280.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
智能网页抓取c#_C#_Html_Web Scraping - Fatal编程技术网

智能网页抓取c#

智能网页抓取c#,c#,html,web-scraping,C#,Html,Web Scraping,有很多产品提供了一个gui来挑选你想要从网页上抓取的标签。(比如WebHarvy) 我以前看过HTML敏捷包,用于获取DOM。 我只是想看看是否有人知道有什么好的库或流程可以自动在HTML页面中找到有用的内容并创建所需的XPath 类似于Evernote和iOS如何知道“文章”在页面上的位置。但是,理想情况下,它可以用于重复区域和分页。不确定这是否是您要寻找的: 但是Diffbot很擅长从网站上抓取内容。我想要的是一个库或者可以内置到我自己解决方案中的东西。我不想依赖第三方。我用过Agilit

有很多产品提供了一个gui来挑选你想要从网页上抓取的标签。(比如WebHarvy)

我以前看过HTML敏捷包,用于获取DOM。 我只是想看看是否有人知道有什么好的库或流程可以自动在HTML页面中找到有用的内容并创建所需的XPath


类似于Evernote和iOS如何知道“文章”在页面上的位置。但是,理想情况下,它可以用于重复区域和分页。

不确定这是否是您要寻找的:


但是Diffbot很擅长从网站上抓取内容。

我想要的是一个库或者可以内置到我自己解决方案中的东西。我不想依赖第三方。我用过Agility Pack,过去没有发现比它更强大的东西。但是如果你找到更好的,我会很感兴趣的。