索引LibreOffice/OpenOffice文件,以便在Plone5中进行全文搜索

索引LibreOffice/OpenOffice文件,以便在Plone5中进行全文搜索,plone,plone-5.x,Plone,Plone 5.x,我试图通过全文搜索找到Plone 5索引LibreOffice/OpenOffice文档、ods、odt和odp。随着OpenXml-1.2.1 Docx&Co的运行,PDF也可以运行 是否有任何指导原则,要做什么,要安装什么 Products/PortalTransforms似乎支持office_uno,所以我运行了一个无头软件--accept=socket,host=localhost,port=2002;urp'--norestore--nofirststartwizard--nologo

我试图通过全文搜索找到Plone 5索引LibreOffice/OpenOffice文档、ods、odt和odp。随着OpenXml-1.2.1 Docx&Co的运行,PDF也可以运行

是否有任何指导原则,要做什么,要安装什么

Products/PortalTransforms似乎支持office_uno,所以我运行了一个无头软件--accept=socket,host=localhost,port=2002;urp'--norestore--nofirststartwizard--nologo--headless
但Port2002从未被触发

在Plone/portal\u转换中,我也看不到office\u uno转换。存在LibreOffice MIME类型

我正在使用 Plone 5.0.6rc1(5016) CMF 2.2.10 佐佩2.13.24 Python 2.7.9(默认值,2016年6月29日,13:08:31)[GCC 4.9.2]
PIL 3.3.1(枕头)

我们使用
ftw.tika
索引所有类型的文件数据。它几乎支持一切。我已经回答了这个问题-->。它没有在Plone 5上进行测试,但它可能是开箱即用的,因为它所做的唯一事情就是注册一个使用apache tika的portal_转换。不确定但可能AROfficeTransform仍然是一个有效的选择(但它似乎没有ftw.tika那么有趣),类似于现有的[pdf_to_text][1]转换您可以使用[odt2txt binary][2]注册您自己的转换(在您的服务器上安装,即使用'apt install odt2txt``)。这只转换文档,而不转换电子表格和其他openoffice/libreoffice格式。[1] :[2]:我发现ftw.tika很难安装,但我从未尝试过。不幸的是,办公室转换没有帮助。在内部,这个egg似乎使用了xsltproc,它从未启动过。扩展ods的MIME类型与转换oo2_到_html的MIME类型相同。所以,我在这里迷路了。我没有看到错误消息。