C# 使用HTML Agility Pack从HTML代码检索数据
以下代码用于检索网站中的热门推文: 当我运行代码时,没有从HTML节点检索到任何内容,但我查看了源代码,发现:C# 使用HTML Agility Pack从HTML代码检索数据,c#,html,C#,Html,以下代码用于检索网站中的热门推文: 当我运行代码时,没有从HTML节点检索到任何内容,但我查看了源代码,发现: <p class='fs-tweet-text'>If only Bradley's arm was longer. Best photo ever. <a class="tweet-url hashtag" href="https://twitter.com/#!/search?q=%23oscars" title="#oscars">#oscars<
<p class='fs-tweet-text'>If only Bradley's arm was longer. Best photo ever. <a class="tweet-url hashtag" href="https://twitter.com/#!/search?q=%23oscars" title="#oscars">#oscars</a> <a href="http://t.co/C9U5NOtGap" title="http://twitter.com/TheEllenShow/status/440322224407314432/photo/1">pic.twitter.com/C9U5NOtGap</a></p>
要是布拉德利的手臂长一点就好了。有史以来最好的照片
资料来源:
HtmlWeb web = new HtmlWeb();
HtmlAgilityPack.HtmlDocument doc;
try
{
doc = web.Load("http://favstar.fm/all-time-most-favorited-tweets");
var Tweetsnodes = doc.DocumentNode.SelectNodes("//p[@class='fs-tweet-text]").ToList();
if (Tweetsnodes != null)
{
for (int i = 0; i <= 4; i++)
{
URLs.Add(Tweetsnodes[i].ToString());
}
}
var Usernodes = doc.DocumentNode.SelectNodes("//a [@class='fs-tweeter']").ToList();
if (Usernodes != null)
{
for (int i = 0; i <= 4; i++)
{
Titles.Add(Usernodes[i].ToString());
}
}
}
catch (Exception ex)
{
MessageBox.Show(ex.Message);
}
HtmlWeb=newhtmlweb();
HtmlAgilityPack.HtmlDocument文档;
尝试
{
doc=web.Load(“http://favstar.fm/all-time-most-favorited-tweets");
var Tweetsnodes=doc.DocumentNode.SelectNodes(“//p[@fs-tweet-text]”)。ToList();
if(Tweetsnodes!=null)
{
对于(int i=0;i您的站点需要设置用户代理
标题。(请参阅代码返回的内容var html=doc.DocumentNode.InnerHtml;
)
您可以将其设置为:
web.UserAgent = "Stackoverflow/1.0";
在修复xpath中的小错误//p[@fs-tweet-text']
后,它应该可以工作了我设置了它并编辑了小错误,但没有工作!!…任何其他解决方案?已解决!。谢谢:)