Web 无需完全下载即可获得zip/rar结构

Web 无需完全下载即可获得zip/rar结构,web,zip,rar,Web,Zip,Rar,在不完全下载的情况下,是否有可能理解网站上的存档中包含的内容? 例如,我想知道里面哪里有pdf文件。如果是,我将下载这样的zip/rar,如果不是,我将跳过它。 因此,是否可以获取归档文件的一小部分并解压缩文件夹/文件结构?除非您可以在远程站点上执行命令。如果您可以使用ssh,那么您可以运行less或unzip之类的操作,使用标志不解压缩,而只是获取可以grep的输出 我怀疑你正在做什么,你将不得不下载它,并在本地做它,但我可以站起来纠正 不管它值多少钱,一旦下载,你就可以在不解压缩的情况下查看

在不完全下载的情况下,是否有可能理解网站上的存档中包含的内容? 例如,我想知道里面哪里有pdf文件。如果是,我将下载这样的zip/rar,如果不是,我将跳过它。
因此,是否可以获取归档文件的一小部分并解压缩文件夹/文件结构?

除非您可以在远程站点上执行命令。如果您可以使用ssh,那么您可以运行less或unzip之类的操作,使用标志不解压缩,而只是获取可以grep的输出

我怀疑你正在做什么,你将不得不下载它,并在本地做它,但我可以站起来纠正

不管它值多少钱,一旦下载,你就可以在不解压缩的情况下查看它 例如
解压-l zipfile


减少zipfile

是的,这是可能的,但我认为这也取决于您下载的服务器。您将需要进行修改以获取所请求的数据片段

对于ZIP文件,您需要获取文件末尾的所有中央目录记录。您可以通过获取足够的最后数据并查找中心目录记录(EOCD)的结尾来完成此操作。如果没有注释,这应该是以0x06054b50开头的最后22个字节。此记录的偏移量为中心目录的起始位置,相对于存档的起始位置。然后你要确定你是否在第一次抓取中下载了所有的数据,或者你是否需要再次抓取更多的数据。之后,您只需解释中心目录文件头,查看ZIP中是否有PDF文件。有关文件格式的信息可以在或在那边的一个参考中找到

对RAR文件执行同样的操作将更加困难,因为没有一个地方可以从中获取所有元数据。您需要检查RAR上所有的文件头块。如果该文件只有一个存档文件,您可以抓取第一个X字节并进行检查。看一看如何解析RAR文件


我对RAR文件也做了同样的事情,但是在基于NZB文件的Usenet中。生成的RAR元数据收集在一个数据库中。您可以在该项目中找到该代码和其他与RAR相关的代码。从HTTP执行同样的操作会容易得多,因为您可以忽略yEnc编码内容,并且可以更精确地选择字节范围。

您使用什么语言和库来解压缩zip/rar?可能每个人的行为都不一样,我还没有决定。我用Java编写代码,所以如果你能提供一些东西,这应该很棒。+1游戏计划的精彩解释+zip/rar布局的详细信息有人在基于.dlc(下载链接容器)文件为rar做这件事。几天后,有工具名为“dlc2srr 0.1”的SRR正在上传。没有公开的源代码。