Indexing sitecore lucene搜索索引中未索引的组件

Indexing sitecore lucene搜索索引中未索引的组件,indexing,lucene,sitecore,lucene.net,sitecore7,Indexing,Lucene,Sitecore,Lucene.net,Sitecore7,我已使用lukeall工具在配置和测试索引中配置了lucene搜索索引。它搜索定义模板的所有字段,但页面上的内容使用另一个外部组件,该组件未搜索,但页面字段中的数据可搜索。 有没有什么方法可以像html搜索一样搜索它,这样页面上的所有数据都可以被索引 谢谢大家。这是一个常见的要求 此屏幕广播概述了一种方法,其中爬虫程序循环遍历页面的每个组件(大约38分钟) 上面的示例使用了旧的高级数据库爬虫程序,但其原理是正确的 另一种常见的方法是在索引中创建一个计算字段,这会导致应用程序请求页面,因此可以刮

我已使用lukeall工具在配置和测试索引中配置了lucene搜索索引。它搜索定义模板的所有字段,但页面上的内容使用另一个外部组件,该组件未搜索,但页面字段中的数据可搜索。 有没有什么方法可以像html搜索一样搜索它,这样页面上的所有数据都可以被索引


谢谢大家。

这是一个常见的要求

此屏幕广播概述了一种方法,其中爬虫程序循环遍历页面的每个组件(大约38分钟)

上面的示例使用了旧的高级数据库爬虫程序,但其原理是正确的

另一种常见的方法是在索引中创建一个计算字段,这会导致应用程序请求页面,因此可以刮取页面的HTML


我的偏好是第二种选择,因为它更准确,或者,如果你想让你的爬网内容完全分开,你可以选择


它还为您提供了一些额外的选项,如跳过部分页面(如菜单、页脚、页眉)

感谢您的回复,我们已经实现了计算字段,这对我们来说很好&在发布完成事件时重建索引。这也是sitecore向我们推荐的