Sharepoint 2010 SharePoint Web爬虫元标记提取的快速算法

Sharepoint 2010 SharePoint Web爬虫元标记提取的快速算法,sharepoint-2010,meta-tags,fast-esp,fastsearch,Sharepoint 2010,Meta Tags,Fast Esp,Fastsearch,我正在使用FAST For SharePoint对非SharepPoint网站进行爬网。该网站爬网没有错误,我可以得到任何关键字的结果 我想通过html页面元标记在结果页面上创建细化器。必须有两级精炼机;类别和子类别。如果用户单击“类别”,精简器面板必须显示所有相关子类别 元标记如下所示: <meta name="Category" content="Products"/> <meta name="SubCategory" content="Electronic"/>

我正在使用FAST For SharePoint对非SharepPoint网站进行爬网。该网站爬网没有错误,我可以得到任何关键字的结果

我想通过html页面元标记在结果页面上创建细化器。必须有两级精炼机;类别和子类别。如果用户单击“类别”,精简器面板必须显示所有相关子类别

元标记如下所示:

<meta name="Category" content="Products"/>
<meta name="SubCategory" content="Electronic"/>

如何提取使用FAST For SharePoint Webcrawler对html页面进行爬网的元标记?

我尝试将元标记名称添加到“快速搜索管理”>“托管属性”和为这些元标记配置的精简程序面板中,但无法得到结果。它不起作用


谢谢大家!

如果要使用自定义托管属性,首先需要将它们绑定到已爬网的属性。爬网属性是在爬网过程中自动创建的,您也可以在powershell中创建它们,请参阅以下链接:

如果我理解的很好,那么您要做的就是获取页面HTML中的信息。在这种情况下,您不能使用现成的web爬虫来获取此信息。如果要创建自定义爬虫程序以获取所需信息,建议您查看自定义BDC连接器: