Sharepoint 本地文件系统上的快速搜索爬网失败,错误为0x80040d07
我已在我的计算机上成功安装Sharepoint 2010和快速搜索Sharepoint 2010。对sharepoint网站进行爬网似乎可以正常工作,但对本地文件系统进行爬网仍会失败,原因如下:Sharepoint 本地文件系统上的快速搜索爬网失败,错误为0x80040d07,sharepoint,sharepoint-2010,fast-esp,fastsearch,Sharepoint,Sharepoint 2010,Fast Esp,Fastsearch,我已在我的计算机上成功安装Sharepoint 2010和快速搜索Sharepoint 2010。对sharepoint网站进行爬网似乎可以正常工作,但对本地文件系统进行爬网仍会失败,原因如下: The start address unknown://win-fs/C:/Users/ravish/FAST_TEST_SET cannot be crawled. Context: Application 'FAST_Content_SSA', Catalog 'Portal_Content'
The start address unknown://win-fs/C:/Users/ravish/FAST_TEST_SET cannot be crawled.
Context: Application 'FAST_Content_SSA', Catalog 'Portal_Content'
Details:
Item not crawled due to one of the following reasons: Preventive crawl rule; Specified content source hops/depth exceeded; URL has query string parameter; Required protocol handler not found; Preventive robots directive. (0x80040d07)
我是从事件视图应用程序日志中得到的。我已确保权限设置为允许运行服务的用户进行读取、列出和执行访问。还尝试更新爬网规则等,使其非常自由
我在Content Source中尝试的URL有:
//win fs/C:/Users/ravish/FAST\u TEST\u SET
file://win-fs/C:/Users/ravish/FAST_TEST_SET
文件:\win fs\C:\Users\ravish\FAST\u TEST\u SET
到目前为止似乎什么都不管用。一直在网络上努力寻找答案,发现许多用户都有类似的问题,但没有一个明确的答案。我已经花了好几个小时,所以任何帮助都将不胜感激
我的系统的详细信息:
Windows Server 2008 R2
Sharepoint企业2010
快速搜索2010
(全部安装在一台笔记本电脑上)我没有使用sharepoint版本的fast,但我认为爬虫程序与以前版本的standalone fast基本相同。在这种情况下——我猜它本身将无法对文件系统进行爬网,因为它是通过http&html处理和爬网的。。。解析页面、以下链接等
您可以设置一个本地Web服务器&allow目录索引,然后以这种方式对“站点”进行爬网。或者您可以使用嵌入的Web服务器,然后再次。。。对本地站点(或所需子集)进行爬网。好的,我想我现在得到了它,重新启动了机器并尝试了以下格式,瞧,它成功了 file://WIN-FS/Users/ravish/FAST_TEST_SET
真不敢相信SP对路径有多挑剔 我认为这是不对的。FAST for sharepoint显然应该能够抓取磁盘上的文件。它在界面中显示了示例URL,但由于我提到的原因,它似乎无法正常工作。