用于搜索bzip文件中一个文件的内容的unix命令

用于搜索bzip文件中一个文件的内容的unix命令,unix,full-text-search,bzip2,Unix,Full Text Search,Bzip2,我有100个条目的file1.txt。需要在file2.bz2文件中搜索file1.txt的内容,这是一个大的bzip文件。 bzgrep-f file1.txt file2.bz2需要很长时间。您什么也做不了。文件已压缩,搜索的唯一方法是将其解压缩。 一种可能的解决方法是保留文件的未压缩版本。您可以做很多事情,但这确实是一项过多的工作 bzip2文件由块组成。您可以将文件分块剪切,对每个文件进行全文索引,然后保存索引。如果你对关键词有一些概念,你可以过滤你的索引,否则你会从所有的文本中得到完整

我有100个条目的file1.txt。需要在file2.bz2文件中搜索file1.txt的内容,这是一个大的bzip文件。
bzgrep-f file1.txt file2.bz2需要很长时间。

您什么也做不了。文件已压缩,搜索的唯一方法是将其解压缩。

一种可能的解决方法是保留文件的未压缩版本。

您可以做很多事情,但这确实是一项过多的工作

bzip2文件由块组成。您可以将文件分块剪切,对每个文件进行全文索引,然后保存索引。如果你对关键词有一些概念,你可以过滤你的索引,否则你会从所有的文本中得到完整的索引。这往往是原始未压缩文档大小的10-100倍

如果只在某些地方出现要编制索引的单词,或者您可以限制要编制索引的单词数量,并且搜索比文档频繁得多,那么您就可以完成这项工作


这是一个很有趣的想法。但只有当你有数百份文件时才会有回报。。。。对于很少的文件,这项工作将比仅仅保持未压缩更昂贵files@RomeoNinov当前位置他没有提到他的比例因子。