C# 从ASP.NET将网页转换为图像
我想在C#中创建一个函数,用于获取特定网页并将其从ASP.NET中转换为JPG图像我不想通过第三方或缩略图服务进行此操作,因为我需要完整的图像。我假设我需要从ASP.NET中以某种方式利用webbrowser控件,但我不知道从哪里开始。有人举过例子吗?好的,当我结合几种不同的解决方案时,这很容易: 这些解决方案为我提供了一种使用ASP.NET中WebBrowser的线程安全方式: 此解决方案为我提供了一种将BMP转换为JPG的方法: 我只是简单地修改了代码,并将以下内容放入.cs中:C# 从ASP.NET将网页转换为图像,c#,asp.net,image,webpage,C#,Asp.net,Image,Webpage,我想在C#中创建一个函数,用于获取特定网页并将其从ASP.NET中转换为JPG图像我不想通过第三方或缩略图服务进行此操作,因为我需要完整的图像。我假设我需要从ASP.NET中以某种方式利用webbrowser控件,但我不知道从哪里开始。有人举过例子吗?好的,当我结合几种不同的解决方案时,这很容易: 这些解决方案为我提供了一种使用ASP.NET中WebBrowser的线程安全方式: 此解决方案为我提供了一种将BMP转换为JPG的方法: 我只是简单地修改了代码,并将以下内容放入.cs中: us
using System.Drawing;
using System.Drawing.Imaging;
using System.IO;
using System.Threading;
using System.Windows.Forms;
public class WebsiteToImage
{
private Bitmap m_Bitmap;
private string m_Url;
private string m_FileName = string.Empty;
public WebsiteToImage(string url)
{
// Without file
m_Url = url;
}
public WebsiteToImage(string url, string fileName)
{
// With file
m_Url = url;
m_FileName = fileName;
}
public Bitmap Generate()
{
// Thread
var m_thread = new Thread(_Generate);
m_thread.SetApartmentState(ApartmentState.STA);
m_thread.Start();
m_thread.Join();
return m_Bitmap;
}
private void _Generate()
{
var browser = new WebBrowser { ScrollBarsEnabled = false };
browser.Navigate(m_Url);
browser.DocumentCompleted += WebBrowser_DocumentCompleted;
while (browser.ReadyState != WebBrowserReadyState.Complete)
{
Application.DoEvents();
}
browser.Dispose();
}
private void WebBrowser_DocumentCompleted(object sender, WebBrowserDocumentCompletedEventArgs e)
{
// Capture
var browser = (WebBrowser)sender;
browser.ClientSize = new Size(browser.Document.Body.ScrollRectangle.Width, browser.Document.Body.ScrollRectangle.Bottom);
browser.ScrollBarsEnabled = false;
m_Bitmap = new Bitmap(browser.Document.Body.ScrollRectangle.Width, browser.Document.Body.ScrollRectangle.Bottom);
browser.BringToFront();
browser.DrawToBitmap(m_Bitmap, browser.Bounds);
// Save as file?
if (m_FileName.Length > 0)
{
// Save
m_Bitmap.SaveJPG100(m_FileName);
}
}
}
public static class BitmapExtensions
{
public static void SaveJPG100(this Bitmap bmp, string filename)
{
var encoderParameters = new EncoderParameters(1);
encoderParameters.Param[0] = new EncoderParameter(System.Drawing.Imaging.Encoder.Quality, 100L);
bmp.Save(filename, GetEncoder(ImageFormat.Jpeg), encoderParameters);
}
public static void SaveJPG100(this Bitmap bmp, Stream stream)
{
var encoderParameters = new EncoderParameters(1);
encoderParameters.Param[0] = new EncoderParameter(System.Drawing.Imaging.Encoder.Quality, 100L);
bmp.Save(stream, GetEncoder(ImageFormat.Jpeg), encoderParameters);
}
public static ImageCodecInfo GetEncoder(ImageFormat format)
{
var codecs = ImageCodecInfo.GetImageDecoders();
foreach (var codec in codecs)
{
if (codec.FormatID == format.Guid)
{
return codec;
}
}
// Return
return null;
}
}
可以这样称呼它:
WebsiteToImage websiteToImage = new WebsiteToImage( "http://www.cnn.com", @"C:\Some Folder\Test.jpg");
websiteToImage.Generate();
它同时适用于文件和流确保在ASP.NET项目中添加对System.Windows.Forms的引用。我希望这有帮助
更新:我已经更新了代码,使其能够捕获整个页面,并且不需要任何特殊设置就可以捕获其中的一部分。Peter Bromberg有一篇关于这个主题的好文章。他的解决方案似乎满足了您的需要……您可以使用它打开一个新浏览器,然后捕获屏幕并进行适当的裁剪。解决方案非常完美,只需在设置图像宽度的线条上进行固定即可。对于高度较大的页面,它没有适当设置宽度:
//browser.ClientSize = new Size(browser.Document.Body.ScrollRectangle.Width, browser.Document.Body.ScrollRectangle.Bottom);
browser.ClientSize = new Size(1000, browser.Document.Body.ScrollRectangle.Bottom);
要添加对System.Windows.Forms的引用,您应该在添加引用的.NET选项卡中而不是在COM-选项卡中执行此操作。以下是我使用扩展方法和任务工厂代替线程的实现:
/// <summary>
/// Convert url to bitmap byte array
/// </summary>
/// <param name="url">Url to browse</param>
/// <param name="width">width of page (if page contains frame, you need to pass this params)</param>
/// <param name="height">heigth of page (if page contains frame, you need to pass this params)</param>
/// <param name="htmlToManipulate">function to manipulate dom</param>
/// <param name="timeout">in milliseconds, how long can you wait for page response?</param>
/// <returns>bitmap byte[]</returns>
/// <example>
/// byte[] img = new Uri("http://www.uol.com.br").ToImage();
/// </example>
public static byte[] ToImage(this Uri url, int? width = null, int? height = null, Action<HtmlDocument> htmlToManipulate = null, int timeout = -1)
{
byte[] toReturn = null;
Task tsk = Task.Factory.StartNew(() =>
{
WebBrowser browser = new WebBrowser() { ScrollBarsEnabled = false };
browser.Navigate(url);
browser.DocumentCompleted += (s, e) =>
{
var browserSender = (WebBrowser)s;
if (browserSender.ReadyState == WebBrowserReadyState.Complete)
{
if (htmlToManipulate != null) htmlToManipulate(browserSender.Document);
browserSender.ClientSize = new Size(width ?? browser.Document.Body.ScrollRectangle.Width, height ?? browser.Document.Body.ScrollRectangle.Bottom);
browserSender.ScrollBarsEnabled = false;
browserSender.BringToFront();
using (Bitmap bmp = new Bitmap(browserSender.Document.Body.ScrollRectangle.Width, browserSender.Document.Body.ScrollRectangle.Bottom))
{
browserSender.DrawToBitmap(bmp, browserSender.Bounds);
toReturn = (byte[])new ImageConverter().ConvertTo(bmp, typeof(byte[]));
}
}
};
while (browser.ReadyState != WebBrowserReadyState.Complete)
{
Application.DoEvents();
}
browser.Dispose();
}, CancellationToken.None, TaskCreationOptions.None, TaskScheduler.FromCurrentSynchronizationContext());
tsk.Wait(timeout);
return toReturn;
}
//
///将url转换为位图字节数组
///
///要浏览的Url
///页面宽度(如果页面包含框架,则需要传递此参数)
///页面高度(如果页面包含框架,则需要传递此参数)
///操作dom的函数
///以毫秒为单位,您可以等待页面响应多长时间?
///位图字节[]
///
///字节[]img=新Uri(“http://www.uol.com.br)。ToImage();
///
公共静态字节[]ToImage(此Uri url,int?width=null,int?height=null,Action htmltoOperation=null,int timeout=-1)
{
字节[]返回=null;
Task tsk=Task.Factory.StartNew(()=>
{
WebBrowser browser=newWebBrowser(){ScrollBarsEnabled=false};
浏览器.导航(url);
browser.DocumentCompleted+=(s,e)=>
{
var browserssender=(WebBrowser)s;
如果(browserSender.ReadyState==WebBrowserReadyState.Complete)
{
如果(HtmlToOperation!=null)HtmlToOperation(browserSender.Document);
browserSender.ClientSize=新大小(宽度??browser.Document.Body.ScrollRectangle.width,高度??browser.Document.Body.ScrollRectangle.Bottom);
browserSender.ScrollBarsEnabled=false;
browserssender.BringToFront();
使用(位图bmp=新位图(browserSender.Document.Body.ScrollRectangle.Width,browserSender.Document.Body.ScrollRectangle.Bottom))
{
browserSender.DrawToBitmap(bmp,browserSender.Bounds);
toReturn=(字节[])new ImageConverter().ConvertTo(bmp,typeof(字节[]));
}
}
};
while(browser.ReadyState!=WebBrowserReadyState.Complete)
{
Application.DoEvents();
}
browser.Dispose();
},CancellationToken.None,TaskCreationOptions.None,TaskScheduler.FromCurrentSynchronizationContext());
等待(超时);
回归回归;
}
卡特·曼多先生提出了一个很好的解决方案
我需要添加一行来抑制某些网页中出现的一些错误
(在我一位了不起的同事的帮助下)
private void\u Generate()
{
var browser=new WebBrowser{ScrollBarsEnabled=false};
browser.ScriptErrorsSuppressed=true;//这将非常困难。哇!这是一个多么好的问题。我的第一反应是使用WebBrowser控件和DrawToBitmap方法,但文档中说,“此控件不支持此方法。”哦,好吧。所以我想DrawToBitmap是有效的。我应该为此得到分数!:O)什么具体地阻止了它的工作?@SLaks-困难是一种心态。除非你尝试,否则你怎么能说某事是困难的?@SLaks-为什么?你具体关心什么?使用WebBrowser控件与生成imag的图表控件没有太大区别我不一定同意使用线程。我可能会使用控件。调用并让控件来处理它。@AMissico:我认为WinForms控件在非交互式会话中工作不可靠。不过,我可能错了。@AMissico从第一篇文章开始:首先,作为Windows窗体控件,它必须运行在STA(单线程单元)线程上。这意味着您需要设置AspCompat=“true”属性,或者您需要对状态已设置为STA的辅助线程上的目标页面进行实际的Webbrowser Navigate调用。我选择后者。@Nissan Fan-好的,我现在明白了。但是,为什么代码未经修改就可以为我工作?即使使用AspCompat=“true | false”,它仍然可以工作。(我在本地ASP.NET开发服务器上使用VS2k8。)@BornToCode在技术上不需要,但让你的应用程序为其他事情释放事件周期。这需要在它自己的过程中启动一个真正的浏览器。这不是一个真正的可伸缩性好的解决方案。+1用于使用任务…但对ext方法的使用不感兴趣。另外,为什么不传递大小、时间跨度等?这些结构存在是有原因的。。。
private void _Generate()
{
var browser = new WebBrowser { ScrollBarsEnabled = false };
browser.ScriptErrorsSuppressed = true; // <--
browser.Navigate(m_Url);
browser.DocumentCompleted += WebBrowser_DocumentCompleted;
}