C# 抓取html页面源代码始终返回null
我正在编写一段代码,从网站获取html页面的源代码 但是变量sourceCode仍然为null,并且它不获取html代码 这是我的代码C# 抓取html页面源代码始终返回null,c#,visual-studio,web-scraping,C#,Visual Studio,Web Scraping,我正在编写一段代码,从网站获取html页面的源代码 但是变量sourceCode仍然为null,并且它不获取html代码 这是我的代码 类HtmlClass { 公共静态字符串getSourceCode(字符串url) { HttpWebRequest req=(HttpWebRequest)WebRequest.Create(url); HttpWebResponse resp=(HttpWebResponse)req.GetResponse(); StreamReader sr=新的Stre
类HtmlClass
{
公共静态字符串getSourceCode(字符串url)
{
HttpWebRequest req=(HttpWebRequest)WebRequest.Create(url);
HttpWebResponse resp=(HttpWebResponse)req.GetResponse();
StreamReader sr=新的StreamReader(resp.GetResponseStream());
字符串sourceCode=sr.ReadToEnd();
高级关闭();
分别关闭();
返回源代码;
}
}
这就是我使用它的地方:
private void按钮3\u单击(对象发送者,事件参数e)
{
字符串url=textBox1.Text;
字符串sourceCode=HtmlClass.getSourceCode(url);
}
你能告诉我可能有什么问题吗?也许你的URL是空的 更简单的方法是:
using System.Net;
using System.Net.Http; // in LINQPad, also add a reference to System.Net.Http.dll
WebRequest req = HttpWebRequest.Create("http://google.com");
req.Method = "GET";
string source;
using (StreamReader reader = new StreamReader(req.GetResponse().GetResponseStream()))
{
source = reader.ReadToEnd();
}
Console.WriteLine(source);
发件人:
可能您的URL为空 更简单的方法是:
using System.Net;
using System.Net.Http; // in LINQPad, also add a reference to System.Net.Http.dll
WebRequest req = HttpWebRequest.Create("http://google.com");
req.Method = "GET";
string source;
using (StreamReader reader = new StreamReader(req.GetResponse().GetResponseStream()))
{
source = reader.ReadToEnd();
}
Console.WriteLine(source);
发件人:
如果您正在使用c#进行刮取,请使用HtmlAgilityPacknuget软件包,或者您也可以从internet下载其dll,这是使用c#进行刮取的最简单方法
然后,您可以轻松地在htmldocument上执行所有必需的操作。请参阅下面的链接以了解相同的信息。
如果您正在使用c#进行刮取,请使用HtmlAgilityPacknuget软件包,或者您也可以从internet下载其dll,这是使用c#进行刮取的最简单方法
然后,您可以轻松地在htmldocument上执行所有必需的操作。请参阅下面的链接以了解相同的信息。