Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/csharp/331.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
C# 如何在HTTPWebRequest中从页面中刮取文本?_C#_Web Scraping - Fatal编程技术网

C# 如何在HTTPWebRequest中从页面中刮取文本?

C# 如何在HTTPWebRequest中从页面中刮取文本?,c#,web-scraping,C#,Web Scraping,如何使用HTTPWebRequest从网站中获取特定文本 我有这段代码,但它只与HREF一起工作,我如何使它与文本一起工作 这是我的代码: // setup variables for scraping int startPos = 0, endPos = 0, length = 0; string tempString = ""; // do the scraping startPos = html.IndexOf(""); endPos = html.IndexOf(">", sta

如何使用HTTPWebRequest从网站中获取特定文本

我有这段代码,但它只与HREF一起工作,我如何使它与文本一起工作

这是我的代码:

// setup variables for scraping
int startPos = 0, endPos = 0, length = 0;
string tempString = "";

// do the scraping
startPos = html.IndexOf("");
endPos = html.IndexOf(">", startPos);
length = endPos - startPos;
tempString = html.Substring(startPos, length);
例如,如果一个页面有此代码,我如何使其只刮去多余的代码

<s class="hash">#</s><b>the1ddiariesareback</b></span></a>
#第二项返修
我建议您使用下载和解析HTML

您可以使用XPath或LINQ to XML语法查询对象模型。

我建议使用来下载并解析HTML


您可以使用XPath或LINQ to XML语法查询对象模型。

如果我不知道XPath、LINQ或XML怎么办?哪些XPath更简单,哪些XPath更简单?@user1017524-XPath并不难,但LINQ有更多的应用程序。所以XPath学习曲线不是很糟糕吗?我应该在一两个小时内掌握它的窍门?@user1017524-基本知识。如果您了解分层文件系统中的路径,您应该能够快速掌握基本语法。如果我不知道XPath、LINQ或XMl,该怎么办?哪一个更简单?XPath还是另一个?@user1017524-XPath并不难,但LINQ有更多的应用程序。所以XPath的学习曲线不是那么糟糕吗?我应该在一两个小时内掌握它的窍门?@user1017524-基本知识。如果您了解分层文件系统中的路径,您应该能够快速掌握基本语法。