Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/search/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/fsharp/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Sharepoint 如何实现用于索引重量级格式的IFilter?_Sharepoint_Search_Ifilter - Fatal编程技术网

Sharepoint 如何实现用于索引重量级格式的IFilter?

Sharepoint 如何实现用于索引重量级格式的IFilter?,sharepoint,search,ifilter,Sharepoint,Search,Ifilter,我需要为MicrosoftSearchServer2008开发一个IFilter,它执行长时间的计算来提取文本。从一个文件中提取文本可能需要5秒到12小时。我如何设计这样一个IFilter,使守护进程不会在超时时重置它,并且如果其他IFilter挂起,也可以在超时时重置它们?我还没有开发任何过滤器,所以我基本上只是猜测,但我始终理解的是,IFilter是基于块的,正是出于这个原因。由过滤器实现来确保返回的块“足够小”,因此,如果时间太长,调用的搜索守护进程可以在两个块之间退出 显然,我的假设是错

我需要为MicrosoftSearchServer2008开发一个IFilter,它执行长时间的计算来提取文本。从一个文件中提取文本可能需要5秒到12小时。我如何设计这样一个IFilter,使守护进程不会在超时时重置它,并且如果其他IFilter挂起,也可以在超时时重置它们?

我还没有开发任何过滤器,所以我基本上只是猜测,但我始终理解的是,IFilter是基于块的,正是出于这个原因。由过滤器实现来确保返回的块“足够小”,因此,如果时间太长,调用的搜索守护进程可以在两个块之间退出

显然,我的假设是错误的,否则你不会问这个问题

12小时,哇

如果需要这么长的时间并且有很多文件,那么最好的选择是创建一个预处理应用程序,该应用程序将提取文本并使iFilter能够访问

另一个选项是创建文档的html摘要,并指示爬虫对这些文档进行索引。如果需要,摘要页面可以轻松链接到文档本身