SQL Server 2012-文件表顶部的全文搜索-未搜索PDF

SQL Server 2012-文件表顶部的全文搜索-未搜索PDF,pdf,sql-server-2012,full-text-search,full-text-indexing,ifilter,Pdf,Sql Server 2012,Full Text Search,Full Text Indexing,Ifilter,使用SQL Server 2012的FILETABLE功能处理大量Office和PDF文档,并在此基础上使用全文搜索,我的脚都湿透了 我已经将SQL Server配置为支持全文搜索和filestream,并且创建了一个文件表,将800多个各种文档转储到文件夹中,所有这些都很好地工作 为了能够对MS Office文档进行全文索引,我安装了MS Filter Pack 2.0,为了处理PDF文件,我下载了Adobe的iFilter for PDF并全部安装 现在,我创建了一个全文目录: CREATE

使用SQL Server 2012的
FILETABLE
功能处理大量Office和PDF文档,并在此基础上使用全文搜索,我的脚都湿透了

我已经将SQL Server配置为支持全文搜索和filestream,并且创建了一个
文件表
,将800多个各种文档转储到文件夹中,所有这些都很好地工作

为了能够对MS Office文档进行全文索引,我安装了MS Filter Pack 2.0,为了处理PDF文件,我下载了Adobe的iFilter for PDF并全部安装

现在,我创建了一个全文目录:

CREATE FULLTEXT CATALOG DocumentCatalog
WITH ACCENT_SENSITIVITY = OFF
然后是
FILETABLE
表上的全文索引:

CREATE FULLTEXT INDEX 
ON dbo.Documents(name, file_type, file_stream)
KEY INDEX [PK_Document]
ON DocumentCatalog
这一切似乎都很顺利。一段时间后,填充我拥有的800多个文档,我可以开始搜索:

SELECT 
    stream_id, name, file_type, cached_file_size, 
    file_stream.GetFileNamespacePath(1)
FROM 
    dbo.Documents
WHERE
    CONTAINS(*, 'Silverlight')
MS Office文档中包含的内容(
*.doc、*.docx、*.ppt、*.pptx、*.xls、*.xlsx
)可以很好地快速找到

不幸的是,PDF文件中似乎找不到任何文本:-(

你知道为什么吗?我在安装过程中没有出现任何错误,看起来一切都很好-我可以在SQL Server的
过滤器中看到
.pdf
文件类型:

SELECT *
FROM sys.fulltext_document_types
返回:

.pdf    E8978DA6-047F-4E3D-9C78-CDBE46041603    
        C:\Program Files\Adobe\Adobe PDF iFilter 11 for 64-bit platforms\bin\PDFFilter.dll    
        11.0.1.36    Adobe Systems, Inc.

但不知何故,这些PDF似乎没有被索引。我能不能有人找出哪些文件实际上被索引了,以及在填充过程中是否有错误?我在哪里可以找到这些信息?

我必须使用Adobe iFilter 9而不是11


你找到解决办法了吗?@Tristan:没有,很遗憾,我没有。。。