Python 需要帮助解压Aztec条形码中存储的zlib数据（德国铁路票）前提_Python_Parsing_Barcode_Zlib_Aztec Barcode

Python 需要帮助解压Aztec条形码中存储的zlib数据（德国铁路票）前提

python parsing

Python 需要帮助解压Aztec条形码中存储的zlib数据（德国铁路票）前提,python,parsing,barcode,zlib,aztec-barcode,Python,Parsing,Barcode,Zlib,Aztec Barcode,我试图从德国铁路公司（Deutsche Bahn）发行的车票上目前使用的条形码格式中解码数据。我发现这个（德语）已经做了类似的事情，并提供了一个新的解决方案该网站声明，数据是用zlib压缩的，生成的blob是用DSA签名的，所有数据都存储在条形码（Aztec格式）中。问题我已经使用网站上提供的脚本成功解码了一张罚单。安装了python-pyasn1库。读取条形码（按照说明使用，NeoReader应用程序有问题）并将结果转换为十六进制。将十六进制数据保存为纯文本文件（由于脚本要求的某些原

我试图从德国铁路公司（Deutsche Bahn）发行的车票上目前使用的条形码格式中解码数据。我发现这个（德语）已经做了类似的事情，并提供了一个新的解决方案

该网站声明，数据是用

zlib

压缩的，生成的blob是用DSA签名的，所有数据都存储在条形码（Aztec格式）中。

问题我已经使用网站上提供的脚本成功解码了一张罚单。安装了python-pyasn1库。读取条形码（按照说明使用，NeoReader应用程序有问题）并将结果转换为十六进制。将十六进制数据保存为纯文本文件（由于脚本要求的某些原因），并使用脚本解析文件。成功了

但是剧本做得太多了。我想自己做解析，但我无法让zlib解压工作，我对代码了解很少，无法理解它。我几乎不懂Python。不过，我有一些编程经验

如果您只是查看条形码中的数据，它看起来如下所示：

第一个问题是： 什么是DSA签名？我需要先将其从实际压缩数据中分离出来吗

第二个： 一个简单的python脚本从文件中读取条形码blob并将其解压缩，这样我就可以进一步解析格式了。我脑子里想的是

#!/usr/bin python

import zlib

ticket = open('ticketdata.txt').read()

print zlib.decompress(ticket)

但它不起作用。任何方向正确的暗示都将不胜感激

如果保存到文件中，脚本可以读取以下十六进制数据：

23 55 54 30 31 30 30 38 30 30 30 30 30 31 30 2c 02 14 1c 3d e9 2d cd 5e c4 c0 56 bd ae 61 3e 54 ad a1 b3 26 33 d2 02 14 40 75 03 d0 cf 9c c1 f5 70 58 bd 59 50 a7 af c5 eb 0a f4 74 00 00 00 00 30 32 37 31 78 9c 65 50 cb 4e c3 30 10 e4 53 2c 71 43 4a d9 f5 2b 36 b7 84 04 52 01 55 51 40 1c 51 01 23 2a 42 0e 21 15 3f c7 8d 1f 63 36 11 52 2b 7c f1 78 76 76 66 bd f7 8f 4d 5d 54 c4 44 ce 10 05 d2 eb 78 5b ac 32 7b b4 77 c8 11 6b 62 c7 d6 79 aa ea aa 16 e1 b2 22 4d c4 01 ad 36 58 61 ca 6b 30 c6 e5 64 a0 b6 97 0f a6 a9 6f d6 71 df c7 cf 3e 7f 37 93 66 8e c6 71 de 92 4c c0 e1 22 0d fd 57 7a cb ee b6 cf ef 69 54 fd 66 44 05 31 d0 03 18 01 05 40 04 70 9c 51 46 ad 38 49 33 00 86 20 dd 42 88 04 22 5f a6 a1 db f6 78 79 d4 79 95 76 1f 3f df fd e7 98 86 16 b1 30 0b 65 d6 3c bd 2a 15 ce d8 ab e5 79 9d 47 7b da 34 13 c7 34 73 5a 6b 0b 35 72 d9 5c 0d bb ae 53 aa e8 5f 86 b4 01 e9 25 8d 0d 50 8e 72 3c 39 3c b2 13 94 82 74 ce 2d c7 b3 41 8b ed 4c 9f f5 0b e2 85 6c 01 8c fe c7 b8 e9 87 8c d9 f1 90 28 a3 73 fe 05 6d de 5f f1

更新/解决方案：马克·阿德勒的建议使我走上了正确的道路。我花了几个小时，但我拼凑出了一个解决这个特殊问题的可行方案。如果我更聪明的话，我会认出偏移量68处的zlib头

78 9C

。在这一点上简单地分割数据，然后第二部分将毫无怨言地解压缩。请注意，非常悲哀的

python

dsa_signature = ''
zlib_data = ''
cursor = 0

with open('ticketdata.txt', "rb") as fp:
    chunk = fp.read(1)
    while chunk:
        if(cursor < 68):
            dsa_signature += chunk
        else:
            zlib_data += chunk

        chunk = fp.read(1)
        cursor = cursor + 1


print "\nSignature:"
print "%s\n" % dsa_signature
print "\nCompressed data:"
print "%s\n" % zlib_data
print "\nDecoded:"
print zlib.decompress(zlib_data)

dsa_签名=“”
zlib_数据=“”
光标=0
打开（'ticketdata.txt'，“rb”）作为fp：
chunk=fp.read（1）
而区块：
如果（光标<68）：
dsa_签名+=块
其他：
zlib_数据+=块
chunk=fp.read（1）
光标=光标+1
打印“\n签名：”
打印“%s\n”%dsa\u签名
打印“\n压缩数据：”
打印“%s\n”%zlib\u数据
打印“\n已编码：”
打印zlib.decompress（zlib_数据）

如果有一个简单的解决办法，请随意评论。我将继续对此进行更多的研究，并尝试使其成为一个更健壮的解决方案，它可以主动查找zlib头，而无需硬编码偏移量。前半部分是一个标识符代码，如

#UT010080000060，

，后面是

ASN.1

DSA签名，幸运的是我不需要验证或修改它。

在十六进制数据中有一个完整有效的zlib流，从偏移量68开始，一直到最后。它解压缩为：

U_HEAD01005300802P9QAN-4��0501201514560DEDEE0080ID0200180104840080BL0203570131204GW3EMP9��06012015060151021193517S0010018FERNWEH车票 NATS00200012S00030001AS00900051-0-0S01200010S0140002S2S0150006柏林0160011NEUMünsterS0210038B Hbf 8:16 ICE794/HH Hbf 10:16 IC2224S0230013Krull Andreas02600021S3S0270019******************0484S02800131Andrea#Krull S031001006.01.2015S032001006.01.2015S03500511160S0360003271

如果删除示例的前68个字节，

zlib.decompress（）

将返回上述内容

由您决定前68个字节是什么。

谢谢！我花了一段时间，但在你的帮助下，我想出了一个解决办法。我相应地更新了问题。