C# 如何在屏幕上刮取网络邮件页面?

C# 如何在屏幕上刮取网络邮件页面?,c#,screen-scraping,C#,Screen Scraping,我正在做一个项目,在其中我需要登录到一个网站,刮网页内容。我尝试了以下代码: protected void Page_Load(object sender, EventArgs e) { WebClient webClient = new WebClient(); string strUrl = "http://www.mail.yahoo.com?username=sakthivel123&password=operator&login=1"; byte

我正在做一个项目,在其中我需要登录到一个网站,刮网页内容。我尝试了以下代码:

protected void Page_Load(object sender, EventArgs e)
{
    WebClient webClient = new WebClient();
    string strUrl = "http://www.mail.yahoo.com?username=sakthivel123&password=operator&login=1";
    byte[] reqHTML;
    reqHTML = webClient.DownloadData(strUrl);
    UTF8Encoding objUTF8 = new UTF8Encoding();
    Label1.Text = objUTF8.GetString(reqHTML1);
}
这将删除邮件的登录页面。但我需要整理一下收件箱的详细信息。请指导我如何进一步操作,提前感谢。

请参阅此问题-

附言:这叫做“刮屏”,而执行屏幕刮屏的动作会被称为(你猜对了!)“刮屏”。“废弃”一词用作动词时表示废弃,例如“项目已废弃!”;-)

请看这个和相关的问题。我们必须先研究网页的HTML源代码,然后才能正确地废弃它。因此,手动登录并获取收件箱页面的来源,然后研究它以获取信息


你为什么不使用雅虎的网络邮件呢?这是一个更好的解决方案。

我建议您首先使用名为Fiddler的工具来分析目标站点和浏览器之间的通信。您可以查看所有http头、cookie、内容等

一旦webClient对象能够复制浏览器的操作(包括登录、设置适当的Cookie等),您就可以自动执行该过程


最后,一旦你得到了想要的HTML,就用正则表达式从中提取你想要的信息。

我想雅虎!将有更严格的安全特性,因此一个简单的查询字符串GET不足以登录到您的帐户。我现在无法访问它,但可能它使用HTTPS隧道。我需要登录并删除该网页。我有如何废弃页面的代码。但我需要自动登录并删除网页内容