C# 如何在HTTPWebRequest中从页面中刮取文本?
如何使用HTTPWebRequest从网站中获取特定文本 我有这段代码,但它只与HREF一起工作,我如何使它与文本一起工作 这是我的代码:C# 如何在HTTPWebRequest中从页面中刮取文本?,c#,web-scraping,C#,Web Scraping,如何使用HTTPWebRequest从网站中获取特定文本 我有这段代码,但它只与HREF一起工作,我如何使它与文本一起工作 这是我的代码: // setup variables for scraping int startPos = 0, endPos = 0, length = 0; string tempString = ""; // do the scraping startPos = html.IndexOf(""); endPos = html.IndexOf(">", sta
// setup variables for scraping
int startPos = 0, endPos = 0, length = 0;
string tempString = "";
// do the scraping
startPos = html.IndexOf("");
endPos = html.IndexOf(">", startPos);
length = endPos - startPos;
tempString = html.Substring(startPos, length);
例如,如果一个页面有此代码,我如何使其只刮去多余的代码
<s class="hash">#</s><b>the1ddiariesareback</b></span></a>
#第二项返修
我建议您使用下载和解析HTML
您可以使用XPath或LINQ to XML语法查询对象模型。我建议使用来下载并解析HTML
您可以使用XPath或LINQ to XML语法查询对象模型。如果我不知道XPath、LINQ或XML怎么办?哪些XPath更简单,哪些XPath更简单?@user1017524-XPath并不难,但LINQ有更多的应用程序。所以XPath学习曲线不是很糟糕吗?我应该在一两个小时内掌握它的窍门?@user1017524-基本知识。如果您了解分层文件系统中的路径,您应该能够快速掌握基本语法。如果我不知道XPath、LINQ或XMl,该怎么办?哪一个更简单?XPath还是另一个?@user1017524-XPath并不难,但LINQ有更多的应用程序。所以XPath的学习曲线不是那么糟糕吗?我应该在一两个小时内掌握它的窍门?@user1017524-基本知识。如果您了解分层文件系统中的路径,您应该能够快速掌握基本语法。