Javascript 检测base64 dataURL映像中的恶意代码或文本

Javascript 检测base64 dataURL映像中的恶意代码或文本,javascript,image,go,base64,base64url,Javascript,Image,Go,Base64,Base64url,我有下面3个“dataURL图像”,如果您通过“URL”打开它们,它们都会返回相同的图像,但是下面的两个dataURL代码在最后一个代码中嵌入了“PHP代码”和“JavaScript代码” 如何从我不信任的用户的base64 dataURL映像中删除这些恶意代码 base64数据URL图像(安全): 

我有下面3个“dataURL图像”,如果您通过“URL”打开它们,它们都会返回相同的图像,但是下面的两个dataURL代码在最后一个代码中嵌入了“PHP代码”和“JavaScript代码”

如何从我不信任的用户的base64 dataURL映像中删除这些恶意代码

base64数据URL图像(安全):




base64数据URL 2图像(注入PHP代码):




base64数据URL 3图像(注入Javascript代码):




您可以使用以下工具“在线解码”来查看文本代码-

我允许用户将图像上传到我的服务器,我将图像“转换”为base64 dataURL图像

从以上所有3个base64 dataURL图像中,您可以看到所有返回的图像都相同,但由于图像中嵌入了文本代码,因此它们的base64代码不同。

我在后台使用Go保存图像。我使用以下HTML代码将图像转换为dataURL base64文本

<input type='file' onchange="readURL(this);" />
<img id="blah" src="#" alt="your image" />
<script>
function readURL(input) {
  if (input.files && input.files[0]) {
    var reader = new FileReader();
    reader.onload = function (e) {
      document.getElementById("blah").src = e.target.result;
    };
    reader.readAsDataURL(input.files[0]);
  }
}
</script>

函数readURL(输入){
if(input.files&&input.files[0]){
var reader=new FileReader();
reader.onload=函数(e){
document.getElementById(“blah”).src=e.target.result;
};
reader.readAsDataURL(input.files[0]);
}
}
我关心的是“文本”不应该出现在图像中,也不应该出现在图像中

上面的dataURL返回相同的图像,但是由于内部有额外的数据,它们有不同的base64代码

我想从上述2个恶意代码中提取实际的image base64代码

让我们假设,用户B上传了图像,我在其中得到“base64 dataURL 3”图像,但我希望base64 dataURL原始图像来自用户上传的图像


如何做到这一点?

ImageMagick
convert-strip
可以做到这一点。它还将删除其他无关数据(EXIF、嵌入的缩略图等),因此请确保行为符合您的要求

$ xxd img.jpg | tail -n 3
00000280: 647f ffd9 3c73 6372 6970 743e 616c 6572  d...<script>aler
00000290: 7428 2768 656c 6c6f 2729 3b3c 2f73 6372  t('hello');</scr
000002a0: 6970 743e 0a                             ipt>.

$ convert -strip img.jpg img2.jpg

$ xxd img2.jpg | tail -n 3       
00000260: 383a 2ebd 4c00 32c8 1ba4 0064 6d3f 229f  8:..L.2....dm?".
00000270: 9001 90a7 e4c8 a1d3 eff9 0019 1800 0647  ...............G
00000280: ffd9
$xxd img.jpg | tail-n 3
00000280:647f ffd9 3c73 6372 6970 743e 616c 6572 d…aler
00000290:7428 2768 656c 6c6f 2729 3b3c 2f73 6372 t(“你好”);。
$convert-strip img.jpg img2.jpg
$xxd img2.jpg |尾-n 3
00000260:383a 2ebd 4c00 32c8 1ba4 0064 6d3f 229f 8:…L.2…dm?”。
00000270:9001 90a7 e4c8 a1d3 eff9 0019 1800 0647
00000280:ffd9
不管怎样,如果你不尝试执行图像,什么都不会发生。但是如果没有其他事情发生,那就是浪费了图像文件中的空间



要在Go上实现这一点,请使用and call

是的,在这个世界上,“图片黑客”(通常称为Stegosploits)是一件事。这里的行业方法是使用(CDR)软件。引用维基百科:

[CDR]是一种计算机安全技术,用于消除潜在的 来自文件的恶意代码。与恶意软件分析不同,CDR技术 不确定或检测恶意软件的功能,但删除所有 在系统定义中归档未经批准的组件 和政策

如果这对您来说是至关重要的,那么您可能希望了解一些可用的商业解决方案(本文还列出了其中的一些,我无法在此给出建议)

对于自行开发的解决方案,重新编码图像可能就足够了

  • 您可能想尝试一下Go的本机库,另请参见
  • Go有一个API绑定,它具有上面提到的strip特性

在正确的上下文中,任何东西都可能是恶意的。只要不要尝试以PHP或JavaScript形式执行图像,你就会没事。不,为什么要这样做是回答这个问题的关键。没有逻辑上的理由尝试以PHP形式执行图像。那么,为什么你认为这是一个问题?关于解码和重新编码的答案没有“我不能保证安全。真正的答案是不要做那些极其愚蠢、毫无用处的事情,那就是
@JohnCargo可能有一些有效的图像会被PHP解释为代码。如果攻击者知道这些图像是如何被重新编码的,那么攻击者就有可能制作一个源图像,将其重新编码为包含malic的图像。”ious代码。我删除了我以前的评论,因为这不是一个好的建议。这里的投票是故意匿名的。你也收到了很多可以解释否决票的评论。你的反应是攻击……如果你尝试执行图像,你会出错,因为图像本身不是有效的JS或PHP。整个任务ion是没有问题的。剥离EXIF对您的用户来说是一个很好的隐私提升,如果没有其他东西的话。如果恶意脚本以其他方式进入您的服务器,带有嵌入数据的图像文件可以用作命令传递机制……尽管攻击者更可能只是使用pastebin。@vgel,您能解释更多关于convert--strip”,这将需要运行“系统级命令”,这在我的场景中不可用。是否有任何不需要运行系统级命令的内容?@JohnCargo是的,您可以使用Go绑定。我在答案中添加了信息。