Python 需要帮助解压Aztec条形码中存储的zlib数据(德国铁路票) 前提

Python 需要帮助解压Aztec条形码中存储的zlib数据(德国铁路票) 前提,python,parsing,barcode,zlib,aztec-barcode,Python,Parsing,Barcode,Zlib,Aztec Barcode,我试图从德国铁路公司(Deutsche Bahn)发行的车票上目前使用的条形码格式中解码数据。我发现这个(德语)已经做了类似的事情,并提供了一个新的解决方案 该网站声明,数据是用zlib压缩的,生成的blob是用DSA签名的,所有数据都存储在条形码(Aztec格式)中。 问题 我已经使用网站上提供的脚本成功解码了一张罚单。 安装了python-pyasn1库。读取条形码(按照说明使用,NeoReader应用程序有问题)并将结果转换为十六进制。将十六进制数据保存为纯文本文件(由于脚本要求的某些原

我试图从德国铁路公司(Deutsche Bahn)发行的车票上目前使用的条形码格式中解码数据。我发现这个(德语)已经做了类似的事情,并提供了一个新的解决方案

该网站声明,数据是用
zlib
压缩的,生成的blob是用DSA签名的,所有数据都存储在条形码(Aztec格式)中。

问题 我已经使用网站上提供的脚本成功解码了一张罚单。 安装了python-pyasn1库。读取条形码(按照说明使用,NeoReader应用程序有问题)并将结果转换为十六进制。将十六进制数据保存为纯文本文件(由于脚本要求的某些原因),并使用脚本解析文件。成功了

但是剧本做得太多了。我想自己做解析,但我无法让zlib解压工作,我对代码了解很少,无法理解它。 我几乎不懂Python。不过,我有一些编程经验

如果您只是查看条形码中的数据,它看起来如下所示:

第一个问题是: 什么是DSA签名?我需要先将其从实际压缩数据中分离出来吗

第二个: 一个简单的python脚本从文件中读取条形码blob并将其解压缩,这样我就可以进一步解析格式了。我脑子里想的是

#!/usr/bin python

import zlib

ticket = open('ticketdata.txt').read()

print zlib.decompress(ticket)
但它不起作用。任何方向正确的暗示都将不胜感激

如果保存到文件中,脚本可以读取以下十六进制数据:

23 55 54 30 31 30 30 38 30 30 30 30 30 31 30 2c 02 14 1c 3d e9 2d cd 5e c4 c0 56 bd ae 61 3e 54 ad a1 b3 26 33 d2 02 14 40 75 03 d0 cf 9c c1 f5 70 58 bd 59 50 a7 af c5 eb 0a f4 74 00 00 00 00 30 32 37 31 78 9c 65 50 cb 4e c3 30 10 e4 53 2c 71 43 4a d9 f5 2b 36 b7 84 04 52 01 55 51 40 1c 51 01 23 2a 42 0e 21 15 3f c7 8d 1f 63 36 11 52 2b 7c f1 78 76 76 66 bd f7 8f 4d 5d 54 c4 44 ce 10 05 d2 eb 78 5b ac 32 7b b4 77 c8 11 6b 62 c7 d6 79 aa ea aa 16 e1 b2 22 4d c4 01 ad 36 58 61 ca 6b 30 c6 e5 64 a0 b6 97 0f a6 a9 6f d6 71 df c7 cf 3e 7f 37 93 66 8e c6 71 de 92 4c c0 e1 22 0d fd 57 7a cb ee b6 cf ef 69 54 fd 66 44 05 31 d0 03 18 01 05 40 04 70 9c 51 46 ad 38 49 33 00 86 20 dd 42 88 04 22 5f a6 a1 db f6 78 79 d4 79 95 76 1f 3f df fd e7 98 86 16 b1 30 0b 65 d6 3c bd 2a 15 ce d8 ab e5 79 9d 47 7b da 34 13 c7 34 73 5a 6b 0b 35 72 d9 5c 0d bb ae 53 aa e8 5f 86 b4 01 e9 25 8d 0d 50 8e 72 3c 39 3c b2 13 94 82 74 ce 2d c7 b3 41 8b ed 4c 9f f5 0b e2 85 6c 01 8c fe c7 b8 e9 87 8c d9 f1 90 28 a3 73 fe 05 6d de 5f f1
更新/解决方案: 马克·阿德勒的建议使我走上了正确的道路。我花了几个小时,但我拼凑出了一个解决这个特殊问题的可行方案。如果我更聪明的话,我会认出偏移量68处的zlib头
78 9C
。在这一点上简单地分割数据,然后第二部分将毫无怨言地解压缩。请注意,非常悲哀的
python

dsa_signature = ''
zlib_data = ''
cursor = 0

with open('ticketdata.txt', "rb") as fp:
    chunk = fp.read(1)
    while chunk:
        if(cursor < 68):
            dsa_signature += chunk
        else:
            zlib_data += chunk

        chunk = fp.read(1)
        cursor = cursor + 1


print "\nSignature:"
print "%s\n" % dsa_signature
print "\nCompressed data:"
print "%s\n" % zlib_data
print "\nDecoded:"
print zlib.decompress(zlib_data)
dsa_签名=“”
zlib_数据=“”
光标=0
打开('ticketdata.txt',“rb”)作为fp:
chunk=fp.read(1)
而区块:
如果(光标<68):
dsa_签名+=块
其他:
zlib_数据+=块
chunk=fp.read(1)
光标=光标+1
打印“\n签名:”
打印“%s\n”%dsa\u签名
打印“\n压缩数据:”
打印“%s\n”%zlib\u数据
打印“\n已编码:”
打印zlib.decompress(zlib_数据)

如果有一个简单的解决办法,请随意评论。我将继续对此进行更多的研究,并尝试使其成为一个更健壮的解决方案,它可以主动查找zlib头,而无需硬编码偏移量。前半部分是一个标识符代码,如
#UT010080000060,
,后面是
ASN.1
DSA签名,幸运的是我不需要验证或修改它。

在十六进制数据中有一个完整有效的zlib流,从偏移量68开始,一直到最后。它解压缩为:

U_HEAD01005300802P9QAN-4������������0501201514560DEDEE0080ID0200180104840080BL0203570131204GW3EMP9�����������06012015060151021193517S0010018FERNWEH车票 NATS00200012S00030001AS00900051-0-0S01200010S0140002S2S0150006柏林0160011NEUMünsterS0210038B Hbf 8:16 ICE794/HH Hbf 10:16 IC2224S0230013Krull Andreas02600021S3S0270019******************0484S02800131Andrea#Krull S031001006.01.2015S032001006.01.2015S03500511160S0360003271

如果删除示例的前68个字节,
zlib.decompress()
将返回上述内容


由您决定前68个字节是什么。

谢谢!我花了一段时间,但在你的帮助下,我想出了一个解决办法。我相应地更新了问题。