C# 获取网站的源代码
我使用以下代码从SharePoint 2010网站获取源代码:C# 获取网站的源代码,c#,httpwebrequest,webrequest,html-content-extraction,C#,Httpwebrequest,Webrequest,Html Content Extraction,我使用以下代码从SharePoint 2010网站获取源代码: try { WebRequest req = HttpWebRequest.Create("myLink"); req.Method = "GET"; req.Credentials = System.Net.CredentialCache.DefaultNetworkCredentials; string source = ""; using (StreamReader reader =
try {
WebRequest req = HttpWebRequest.Create("myLink");
req.Method = "GET";
req.Credentials = System.Net.CredentialCache.DefaultNetworkCredentials;
string source = "";
using (StreamReader reader = new StreamReader(req.GetResponse().GetResponseStream())) {
source += reader.ReadToEnd();
}
}
从源字符串中,我可以搜索我在网站上寻找的关键字
现在SharePoint已迁移到2016年,我无法再查看源代码中的特定内容
但是,例如,可以使用chrome的集成web开发工具来查看网站的结构。在本例中,我要查找的内容也是可见的
如何使用C#?以编程方式获取此信息请尝试以下方法:
using (WebClient client = new WebClient ()) // WebClient class inherits IDisposable
{
client .Headers.Add("user-agent", "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2228.0 Safari/537.36");
string htmlCode = client.DownloadString("myLink");
//...
}
不幸的是,同样的结果。显示源代码,但不显示“真实”内容仍不工作。我有大约400行的源代码,但是缺少简单的内容。你可以试着用Fiddler将你的请求与一个好的请求进行比较吗?注意:有些站点需要UserAgent提供所需的响应,可能需要其他标题。