扩展果园';s搜索/索引模块,用于搜索已上载的Word、Excel、Powerpoint和PDF文件

扩展果园';s搜索/索引模块,用于搜索已上载的Word、Excel、Powerpoint和PDF文件,pdf,indexing,ms-office,orchardcms,orchardcms-1.6,Pdf,Indexing,Ms Office,Orchardcms,Orchardcms 1.6,显然,以下模块仅索引Orchard站点中的内容: 如果我上传文档、XLS、PPT或PDF文件,其内容将不会添加到索引中 是否有现成的方法包含这些内容,或者我必须扩展索引机制? 如果后者是真的,欢迎任何关于如何做到这一点的提示。谢谢大家! 编辑:所谓“上传文件”,我指的是标准媒体上传到/media文件夹。它不是现成的,但可以自己实现,特别是即将推出的Orchard 1.7,它将使上传的媒体文件成为内容项 这有几个扩展点,其中OnIndexingcontenthandler方法是最简单、最直接的使

显然,以下模块仅索引Orchard站点中的内容:

如果我上传文档、XLS、PPT或PDF文件,其内容将不会添加到索引中

是否有现成的方法包含这些内容,或者我必须扩展索引机制?

如果后者是真的,欢迎任何关于如何做到这一点的提示。谢谢大家!


编辑:所谓“上传文件”,我指的是标准媒体上传到
/media
文件夹。

它不是现成的,但可以自己实现,特别是即将推出的Orchard 1.7,它将使上传的媒体文件成为内容项

这有几个扩展点,其中
OnIndexing
contenthandler方法是最简单、最直接的使用方法。这是提取关键字并将其添加到索引的地方。查看现有的实现以获取示例


说到关键词提取——我用于PDF和处理Office文档(尽管它只适用于新格式——DOCX、PPTX和XLSX)。对于传统的非XML Office格式,您需要一些其他库—web上有很多库。

它不是现成的,但可以自己实现,特别是即将推出的Orchard 1.7,它将使上载的媒体文件成为内容项

这有几个扩展点,其中
OnIndexing
contenthandler方法是最简单、最直接的使用方法。这是提取关键字并将其添加到索引的地方。查看现有的实现以获取示例


说到关键词提取——我用于PDF和处理Office文档(尽管它只适用于新格式——DOCX、PPTX和XLSX)。对于传统的非XML Office格式,您需要一些其他库—web上有很多这样的库。

据我所知,没有现成的方法。我不太熟悉Orchard如何使用Lucene.net为内容编制索引,但您可以使用ITextSharp覆盖默认媒体处理并提取pdf内容。然后,您应该能够连接到索引api并为其编制索引。据我所知,没有现成的方法。我不太熟悉Orchard如何使用Lucene.net为内容编制索引,但您可以使用ITextSharp覆盖默认媒体处理并提取pdf内容。然后,您应该能够连接到索引api并为其编制索引。iFilter(由sharepoint等使用)似乎非常流行。支持这些将是支持多种类型的快捷方式谢谢!您是否有记录Orchard 1.7中媒体处理更改的链接?我下载了最新的资源并上传了一些媒体文件,但它们的处理方式似乎没有什么不同。ContentTypeRecord表没有媒体文件条目:抱歉,我的错误,在错误的分支上。如果其他人正在搜索它,这里有一个链接:iFilter(由sharepoint等使用)似乎非常流行。支持这些将是支持多种类型的快捷方式谢谢!您是否有记录Orchard 1.7中媒体处理更改的链接?我下载了最新的资源并上传了一些媒体文件,但它们的处理方式似乎没有什么不同。ContentTypeRecord表没有媒体文件条目:抱歉,我的错误,在错误的分支上。如果其他人正在搜索,请点击以下链接: