Web 无需完全下载即可获得zip/rar结构_Web_Zip_Rar

Web 无需完全下载即可获得zip/rar结构

web

Web 无需完全下载即可获得zip/rar结构,web,zip,rar,Web,Zip,Rar,在不完全下载的情况下，是否有可能理解网站上的存档中包含的内容？例如，我想知道里面哪里有pdf文件。如果是，我将下载这样的zip/rar，如果不是，我将跳过它。因此，是否可以获取归档文件的一小部分并解压缩文件夹/文件结构？除非您可以在远程站点上执行命令。如果您可以使用ssh，那么您可以运行less或unzip之类的操作，使用标志不解压缩，而只是获取可以grep的输出我怀疑你正在做什么，你将不得不下载它，并在本地做它，但我可以站起来纠正不管它值多少钱，一旦下载，你就可以在不解压缩的情况下查看

在不完全下载的情况下，是否有可能理解网站上的存档中包含的内容？例如，我想知道里面哪里有pdf文件。如果是，我将下载这样的zip/rar，如果不是，我将跳过它。

因此，是否可以获取归档文件的一小部分并解压缩文件夹/文件结构？

除非您可以在远程站点上执行命令。如果您可以使用ssh，那么您可以运行less或unzip之类的操作，使用标志不解压缩，而只是获取可以grep的输出

我怀疑你正在做什么，你将不得不下载它，并在本地做它，但我可以站起来纠正

不管它值多少钱，一旦下载，你就可以在不解压缩的情况下查看它例如

解压-l zipfile

或

减少zipfile

是的，这是可能的，但我认为这也取决于您下载的服务器。您将需要进行修改以获取所请求的数据片段

对于ZIP文件，您需要获取文件末尾的所有中央目录记录。您可以通过获取足够的最后数据并查找中心目录记录（EOCD）的结尾来完成此操作。如果没有注释，这应该是以0x06054b50开头的最后22个字节。此记录的偏移量为中心目录的起始位置，相对于存档的起始位置。然后你要确定你是否在第一次抓取中下载了所有的数据，或者你是否需要再次抓取更多的数据。之后，您只需解释中心目录文件头，查看ZIP中是否有PDF文件。有关文件格式的信息可以在或在那边的一个参考中找到

对RAR文件执行同样的操作将更加困难，因为没有一个地方可以从中获取所有元数据。您需要检查RAR上所有的文件头块。如果该文件只有一个存档文件，您可以抓取第一个X字节并进行检查。看一看如何解析RAR文件

我对RAR文件也做了同样的事情，但是在基于NZB文件的Usenet中。生成的RAR元数据收集在一个数据库中。您可以在该项目中找到该代码和其他与RAR相关的代码。从HTTP执行同样的操作会容易得多，因为您可以忽略yEnc编码内容，并且可以更精确地选择字节范围。

您使用什么语言和库来解压缩zip/rar？可能每个人的行为都不一样，我还没有决定。我用Java编写代码，所以如果你能提供一些东西，这应该很棒。+1游戏计划的精彩解释+zip/rar布局的详细信息有人在基于.dlc（下载链接容器）文件为rar做这件事。几天后，有工具名为“dlc2srr 0.1”的SRR正在上传。没有公开的源代码。