Algorithm PDF阅读器-查找单词的算法

Algorithm PDF阅读器-查找单词的算法,algorithm,pdf,Algorithm,Pdf,当键入Ctrl+F时,pdf阅读器如何查找特定的单词/表达式 有没有比线性搜索更快的算法来执行这样的任务?不同的PDF阅读器会有所不同,但我猜可能是一些已知的快速字符串匹配算法,或者可能同时在所有文档页面上并行运行。对于短文本字符串,这应该是非常非常快的 他们也很有可能使用上述算法的混合/修改算法。不同的PDF阅读器会有所不同,但我猜可能是一些已知的快速字符串匹配算法,或者可能同时在所有文档页面上并行运行。对于短文本字符串,这应该是非常非常快的 他们也很有可能使用上述算法的混合/修改算法。搜索算

当键入Ctrl+F时,pdf阅读器如何查找特定的单词/表达式


有没有比线性搜索更快的算法来执行这样的任务?

不同的PDF阅读器会有所不同,但我猜可能是一些已知的快速字符串匹配算法,或者可能同时在所有文档页面上并行运行。对于短文本字符串,这应该是非常非常快的


他们也很有可能使用上述算法的混合/修改算法。

不同的PDF阅读器会有所不同,但我猜可能是一些已知的快速字符串匹配算法,或者可能同时在所有文档页面上并行运行。对于短文本字符串,这应该是非常非常快的


他们也很有可能使用上述算法的混合/修改算法。

搜索算法在PDF中查找单词的速度与使用的特定算法关系不大,更取决于使用什么算法来确定哪组绘图指令首先构成一个单词,以及它们的顺序。一些PDF创建工具将创建一条指令,将整行文本设置为单个指令,每个单词之间留有空格。但是,如果在创作工具中对该行应用了任何类型的非标准间距,则PDF可能会逐个字符放置每个单词,而完全没有空格。还有一些人会试图避免加载字体的内存负担,并创建PDF,以便首先呈现所有普通文本,然后呈现所有粗体文本,然后呈现所有斜体文本,逐个字体。因此,如果你只是按照文本绘制的顺序提取文本,你就不能得到真正的阅读顺序


更好的工具需要更长的时间,但会使这个过程正确。在这之后,搜索的时间就不多了。

搜索算法在PDF中查找单词的速度与所使用的特定算法关系不大,更取决于使用什么算法来确定哪些绘图指令集首先构成单词以及它们的顺序。一些PDF创建工具将创建一条指令,将整行文本设置为单个指令,每个单词之间留有空格。但是,如果在创作工具中对该行应用了任何类型的非标准间距,则PDF可能会逐个字符放置每个单词,而完全没有空格。还有一些人会试图避免加载字体的内存负担,并创建PDF,以便首先呈现所有普通文本,然后呈现所有粗体文本,然后呈现所有斜体文本,逐个字体。因此,如果你只是按照文本绘制的顺序提取文本,你就不能得到真正的阅读顺序


更好的工具需要更长的时间,但会使这个过程正确。在那之后,搜索的时间就不多了。

太宽泛了。有很多关于搜索和子字符串搜索的长文章。。。也许你的问题是从off获取文本而不是搜索?太广泛了。有很多关于搜索和子字符串搜索的长文章。。。也许你的问题是从off获取文本,而不是搜索?