Content management system 类型3:索引搜索和爬虫关系

Content management system 类型3:索引搜索和爬虫关系,content-management-system,web-crawler,typo3,Content Management System,Web Crawler,Typo3,我已经用TYPO3索引搜索做了几个网站。然而,我觉得我仍然不理解索引搜索和爬虫之间的关系的本质。例如,根据一些给tt_新闻编制索引的作者的说法,我只需要一个通用的爬虫配置和tt_新闻的索引搜索配置;但是对于其他教程的作者,我应该为tt_新闻创建一个爬虫配置 我不清楚爬虫和索引搜索之间的关系。他们如何匹配?根爬虫配置在找到索引的搜索配置时只运行它,这难道还不够吗?或者URL是否需要由两者生成?我已经设法用一个爬虫根配置创建了一个索引,但是我通过调用cli_dispatch.phpsh的shell脚

我已经用TYPO3索引搜索做了几个网站。然而,我觉得我仍然不理解索引搜索和爬虫之间的关系的本质。例如,根据一些给tt_新闻编制索引的作者的说法,我只需要一个通用的爬虫配置和tt_新闻的索引搜索配置;但是对于其他教程的作者,我应该为tt_新闻创建一个爬虫配置

我不清楚爬虫和索引搜索之间的关系。他们如何匹配?根爬虫配置在找到索引的搜索配置时只运行它,这难道还不够吗?或者URL是否需要由两者生成?我已经设法用一个爬虫根配置创建了一个索引,但是我通过调用cli_dispatch.phpsh的shell脚本运行了索引

索引搜索和爬虫在功能(生成URL)方面是否冗余

欢迎提供任何线索

最好的


B.

索引搜索可以在没有爬虫的情况下通过索引访问者访问的页面来工作。明显的缺点是,未访问的页面不会被索引,因此不会显示在搜索结果中。如果配置了多个前端用户组,则访问页面的可能性更低

爬虫可以通过访问每个页面来解决这个问题。此外,它可以访问页面,就像它是FE用户组(组合)的成员一样。这样,它可以帮助为各种用户建立整个网站的索引

大部分细节由泽维尔·珀尔斯盖尔斯在一篇文章中解释。它是为旧版本编写的,但我想大部分仍然有效。
(我上次使用索引搜索已经有一段时间了,但当时的教程帮助很大)。

索引搜索可以在没有爬虫的情况下为访问者访问的页面编制索引。明显的缺点是,未访问的页面不会被索引,因此不会显示在搜索结果中。如果配置了多个前端用户组,则访问页面的可能性更低

爬虫可以通过访问每个页面来解决这个问题。此外,它可以访问页面,就像它是FE用户组(组合)的成员一样。这样,它可以帮助为各种用户建立整个网站的索引

大部分细节由泽维尔·珀尔斯盖尔斯在一篇文章中解释。它是为旧版本编写的,但我想大部分仍然有效。
(我上次使用索引搜索已经有一段时间了,但当时的教程帮助很大)。

Hi。非常感谢你的回答。事实上,我已经用了好几次那个教程。这在很大程度上是一个食谱类型的教程。我想更好地了解索引搜索的内部。在最新的版本中,使用了流体,并且出现了一些bug(从我的角度来看)。我还想了解为什么爬虫和索引搜索的功能存在双重性。Jigal,也许你知道答案:为什么爬虫im脚本不处理索引搜索挂钩,而爬虫脚本处理索引搜索挂钩?我知道这是事实,因为我正在审查源代码,对我来说,它完全没有逻辑。你对此有什么见解吗?你好。非常感谢你的回答。事实上,我已经用了好几次那个教程。这在很大程度上是一个食谱类型的教程。我想更好地了解索引搜索的内部。在最新的版本中,使用了流体,并且出现了一些bug(从我的角度来看)。我还想了解为什么爬虫和索引搜索的功能存在双重性。Jigal,也许你知道答案:为什么爬虫im脚本不处理索引搜索挂钩,而爬虫脚本处理索引搜索挂钩?我知道这是事实,因为我正在审查源代码,对我来说,它完全没有逻辑。你对此有什么见解吗?最好的。