SQL Server 2012-文件表顶部的全文搜索-未搜索PDF
使用SQL Server 2012的SQL Server 2012-文件表顶部的全文搜索-未搜索PDF,pdf,sql-server-2012,full-text-search,full-text-indexing,ifilter,Pdf,Sql Server 2012,Full Text Search,Full Text Indexing,Ifilter,使用SQL Server 2012的FILETABLE功能处理大量Office和PDF文档,并在此基础上使用全文搜索,我的脚都湿透了 我已经将SQL Server配置为支持全文搜索和filestream,并且创建了一个文件表,将800多个各种文档转储到文件夹中,所有这些都很好地工作 为了能够对MS Office文档进行全文索引,我安装了MS Filter Pack 2.0,为了处理PDF文件,我下载了Adobe的iFilter for PDF并全部安装 现在,我创建了一个全文目录: CREATE
FILETABLE
功能处理大量Office和PDF文档,并在此基础上使用全文搜索,我的脚都湿透了
我已经将SQL Server配置为支持全文搜索和filestream,并且创建了一个文件表
,将800多个各种文档转储到文件夹中,所有这些都很好地工作
为了能够对MS Office文档进行全文索引,我安装了MS Filter Pack 2.0,为了处理PDF文件,我下载了Adobe的iFilter for PDF并全部安装
现在,我创建了一个全文目录:
CREATE FULLTEXT CATALOG DocumentCatalog
WITH ACCENT_SENSITIVITY = OFF
然后是FILETABLE
表上的全文索引:
CREATE FULLTEXT INDEX
ON dbo.Documents(name, file_type, file_stream)
KEY INDEX [PK_Document]
ON DocumentCatalog
这一切似乎都很顺利。一段时间后,填充我拥有的800多个文档,我可以开始搜索:
SELECT
stream_id, name, file_type, cached_file_size,
file_stream.GetFileNamespacePath(1)
FROM
dbo.Documents
WHERE
CONTAINS(*, 'Silverlight')
MS Office文档中包含的内容(*.doc、*.docx、*.ppt、*.pptx、*.xls、*.xlsx
)可以很好地快速找到
不幸的是,PDF文件中似乎找不到任何文本:-(
你知道为什么吗?我在安装过程中没有出现任何错误,看起来一切都很好-我可以在SQL Server的过滤器中看到.pdf
文件类型:
SELECT *
FROM sys.fulltext_document_types
返回:
.pdf E8978DA6-047F-4E3D-9C78-CDBE46041603
C:\Program Files\Adobe\Adobe PDF iFilter 11 for 64-bit platforms\bin\PDFFilter.dll
11.0.1.36 Adobe Systems, Inc.
但不知何故,这些PDF似乎没有被索引。我能不能有人找出哪些文件实际上被索引了,以及在填充过程中是否有错误?我在哪里可以找到这些信息?我必须使用Adobe iFilter 9而不是11
你找到解决办法了吗?@Tristan:没有,很遗憾,我没有。。。