elasticsearch,apache-tika,manifoldcf,Pdf,elasticsearch,Apache Tika,Manifoldcf" /> elasticsearch,apache-tika,manifoldcf,Pdf,elasticsearch,Apache Tika,Manifoldcf" />

Pdf 阿帕奇ManifoldCF TIKA

Pdf 阿帕奇ManifoldCF TIKA,pdf,elasticsearch,apache-tika,manifoldcf,Pdf,elasticsearch,Apache Tika,Manifoldcf,我正在尝试使用ApacheManifoldcf上的ApacheTika集成来提取PDF的文本内容,以便在Elasticsearch服务器中接收我笔记本电脑上的一些PDF文件 在正确创建Tika Transformer并在我的作业中对其进行配置之后,我看到ES上的结果字段“_content”填充了文件的二进制编码,而不是文本 我也看到了这一点:,但仍然没有提供答案(自2015年以来!) 有人能帮我吗 谢谢 在弹性搜索的输出连接器中,您为内容字段指定的字段名是什么 请提供字段名和最大文档大小 在弹性

我正在尝试使用ApacheManifoldcf上的ApacheTika集成来提取PDF的文本内容,以便在Elasticsearch服务器中接收我笔记本电脑上的一些PDF文件

在正确创建Tika Transformer并在我的作业中对其进行配置之后,我看到ES上的结果字段“_content”填充了文件的二进制编码,而不是文本

我也看到了这一点:,但仍然没有提供答案(自2015年以来!)

有人能帮我吗


谢谢

在弹性搜索的输出连接器中,您为内容字段指定的字段名是什么


请提供字段名和最大文档大小

在弹性搜索的输出连接器中,您为内容字段指定的字段名是什么

请提供字段名和最大文档大小