XSLT:获取或匹配base64编码数据的哈希
我需要找到一种方法来找到XML节点//note/resource/data中base64编码数据的哈希值,或者以某种方式将其与节点//note/content/en note//en中的哈希值相匹配-media@hash 请参见下面的完整XML文件 请建议使用XSLT{获取|匹配}的方法XSLT:获取或匹配base64编码数据的哈希,xslt,hash,image-manipulation,md5,evernote,Xslt,Hash,Image Manipulation,Md5,Evernote,我需要找到一种方法来找到XML节点//note/resource/data中base64编码数据的哈希值,或者以某种方式将其与节点//note/content/en note//en中的哈希值相匹配-media@hash 请参见下面的完整XML文件 请建议使用XSLT{获取|匹配}的方法 4aaafc3e14314027bb1d89cf7d59a06c {from| with} R0lGODlhEAAQAPMAMcDAwP/crv/erbigfVdLOyslHQAAAAECAwECAwECAw
4aaafc3e14314027bb1d89cf7d59a06c
{from| with}
R0lGODlhEAAQAPMAMcDAwP/crv/erbigfVdLOyslHQAAAAECAwECAwECAwECAwECAwECAwECAwEC
AwECAyH/C01TT0ZGSUNFOS4wGAAAAAxtc09QTVNPRkZJQ0U5LjAHgfNAGQAh/wtNU09GRklDRTku
MBUAAAAJcEhZcwAACxMAAAsTAQCanBgAIf8LTVNPRkZJQ0U5LjATAAAAB3RJTUUH1AkWBTYSQXe8
fQAh+QQBAAAAACwAAAAAEAAQAAADSQhgpv7OlDGYstCIMqsZAXYJJEdRQRWRrHk2I9t28CLfX63d
ZEXovJ7htwr6dIQB7/hgJGXMzFApOBYgl6n1il0Mv5xuhBEGJAAAOw==
显然,为了简洁/简单起见,对这个示例XML文件进行了裁剪。实际每个注释可能包含>1个图像,因此需要获取/匹配哈希
XML文件:
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE en-export SYSTEM "http://xml.evernote.com/pub/evernote-export.dtd">
<en-export export-date="20091029T063411Z" application="Evernote/Windows" version="3.0">
<note>
<title>A title here</title>
<content><![CDATA[
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE en-note SYSTEM "http://xml.evernote.com/pub/enml.dtd">
<en-note bgcolor="#FFFFFF">
<p>Some text here (followed by the picture)
<p><en-media hash="4aaafc3e14314027bb1d89cf7d59a06c" type="image/gif" border="0" width="16" height="16" alt="A picture"/></p>
<p>Some more text here (preceded by the picture)
</en-note>
]]></content>
<created>20090925T063154Z</created>
<note-attributes>
<author/>
</note-attributes>
<resource>
<data encoding="base64">
R0lGODlhEAAQAPMAMcDAwP/crv/erbigfVdLOyslHQAAAAECAwECAwECAwECAwECAwECAwECAwEC
AwECAyH/C01TT0ZGSUNFOS4wGAAAAAxtc09QTVNPRkZJQ0U5LjAHgfNAGQAh/wtNU09GRklDRTku
MBUAAAAJcEhZcwAACxMAAAsTAQCanBgAIf8LTVNPRkZJQ0U5LjATAAAAB3RJTUUH1AkWBTYSQXe8
fQAh+QQBAAAAACwAAAAAEAAQAAADSQhgpv7OlDGYstCIMqsZAXYJJEdRQRWRrHk2I9t28CLfX63d
ZEXovJ7htwr6dIQB7/hgJGXMzFApOBYgl6n1il0Mv5xuhBEGJAAAOw==
</data>
<mime>image/gif</mime>
<resource-attributes>
<file-name>clip_image001.gif</file-name>
</resource-attributes>
</resource>
</note>
</en-export>
这里有一个标题
这里有一些文字(后面是图片)
这里有更多的文字(前面有图片)
]]>
20090925T063154Z
. 主要区别在于我避免创建自己的Java类(并创建额外的依赖项)。我在XSLT中进行处理,因为它非常简单,只引用基本Java库附带的外部依赖项。
Jackem的解决方案更正确,因为它不会在一些散列中丢失前导零,但是我发现在其他地方使用li'l basic hackery处理这个问题要容易得多
<xsl:stylesheet version="2.0"
xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
...
xmlns:md5="java.security.MessageDigest"
xmlns:bigint="java.math.BigInteger"
exclude-result-prefixes="md5 bigint">
...
<xsl:for-each select="resource">
<xsl:variable name="md5inst" select="md5:getInstance('MD5')" />
<xsl:value-of select="md5:update($md5inst, $b64bin)" />
<xsl:variable name="imgmd5bytes" select="md5:digest($md5inst)" />
<xsl:variable name="imgmd5bigint" select="bigint:new(1, $imgmd5bytes)" />
<xsl:variable name="imgmd5str" select="bigint:toString($imgmd5bigint, 16)" />
<!-- NOTE: $imgmd5str loses the leading zero from imgmd5bytes (if there is one) -->
</xsl:for-each>
...
...
...
另请参阅,以了解我对base64-->图像文件
转换的实现
这个问题是的一个子问题。
- 下载一些免费的Base64解码器,或者从网上下载一些源代码
- 输出文件是一些_file.gif,268字节,一个文件夹图标
- 使用或再次使用来自web的一些源代码生成该文件的MD5校验和
我的输出:
4aaafc3e14314027bb1d89cf7d59a06c
这就是你想要的,不是吗?
在XSLT中完成所有这一切将是一件棘手的事情(如果不是不可能的话,如果你问我的话,肯定不值得这么做),但至少你现在已经知道这个哈希是在GIF文件上使用MD5创建的 4aaaf…
是解码base64编码数据时获得的二进制数据的MD5。我认为您别无选择,只能解码
元素的内容并通过MD5实现运行它,这显然超出了XSL转换的范围。据推测,XSLT的结果将由其他一些代码处理,这些代码可以提取和验证图像。关于在XSLT中执行base64解码的相关问题,您有使用Saxon和Java扩展的代码。所以我想你可以用这些
在这种情况下,您可以使用Java创建一个扩展来计算MD5和:
package com.stackoverflow.q1684963;
import java.math.BigInteger;
import java.security.MessageDigest;
import java.security.NoSuchAlgorithmException;
public class MD5Sum {
public static String calc(byte[] data) throws NoSuchAlgorithmException {
MessageDigest md5 = MessageDigest.getInstance("MD5");
byte[] digest = md5.digest(data);
BigInteger digestValue = new BigInteger(1, digest);
return String.format("%032x", digestValue);
}
}
从使用Saxon运行的XSLT2.0样式表中,您可以调用该扩展。假设您在变量data
中已经有base64解码数据(例如,从扩展函数saxon:base64二进制到八位字节,如链接答案中所示):
<xsl:value-of xmlns:md5sum="com.stackoverflow.q1684963.MD5Sum"
select="md5sum:calc($data)"/>
如何(添加到类路径):
[...]
我承认使用OTU XSLT会更容易,但我想用XSLT做其他事情,因此这个问题。我已经能够找到如何在XSLT中解码base64,但现在需要找到一种方法来获取th md5sum,当然是使用XSLT。我发现的唯一一件事是2004年exslt邮件列表中的一条消息,其中有人试图开发一个可以生成MD5和其他校验和的加密命名空间,但这似乎是一条死胡同——请看这里:谢谢!我使用相同的概念成功地实现了它,只是我自己没有创建类,只是从XSLT中调用了这些方法。我会把我的建议寄出去。soln很快…值得称赞的地方:Java代码是根据问题的各种答案改编而成的
<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
xmlns:digest="org.apache.commons.codec.digest.DigestUtils">
[...]
<xsl:value-of select="digest:md5Hex('hello, world!')"/>
</xsl:stylesheet>