Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/php/240.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Php 我可以通过将SOLR xml文档中的路径与文档中的其他值一起传递来搜索pdf和.doc文件吗_Php_Xml_Pdf_Solr_Doc - Fatal编程技术网

Php 我可以通过将SOLR xml文档中的路径与文档中的其他值一起传递来搜索pdf和.doc文件吗

Php 我可以通过将SOLR xml文档中的路径与文档中的其他值一起传递来搜索pdf和.doc文件吗,php,xml,pdf,solr,doc,Php,Xml,Pdf,Solr,Doc,大家好,请告诉我是否可以通过xml文档传递路径来搜索pdf和word文件。。。所以xml文件将是这样的 <doc> <field name="id">1</field> <field name="name">A</field> <field name="sk">Acce</field> <field name="level">Beginner</field>

大家好,请告诉我是否可以通过xml文档传递路径来搜索pdf和word文件。。。所以xml文件将是这样的

<doc>
    <field name="id">1</field>
    <field name="name">A</field>
    <field name="sk">Acce</field>
    <field name="level">Beginner</field>
    <field name="do">Tuto</field>
    <field name="open">1</field>
    <field name="type">Ct</field>
    <field name="extensis">cl_ex</field>
    <field name="features">Atos</field>
    <field name="downl"></field>
    <field name="source">Atoms</field>
    <field name="description">Ths.</field>
    <field name="file_path">http://www.abcd.com/files/abcd.pdf</field>

  </doc>

  <doc>
    <field name="id">2</field>
    <field name="name">Ar</field>
    <field name="sk">Acrce</field>
    <field name="level">Beginner</field>
    <field name="do">Tuto1</field>
    <field name="open">11</field>
    <field name="type">C1t</field>
    <field name="extensis">cl_exd</field>
    <field name="features">Atos</field>
    <field name="downl"></field>
    <field name="source">ddddd</field>
    <field name="description">Thsdd.</field>
    <field name="file_path">http://www.abcd.com/files/abcd.pdf</field>

  </doc>

1.
A.
Acce
初学者
图图
1.
计算机断层扫描
氯离子交换
阿托斯
原子
Ths。
http://www.abcd.com/files/abcd.pdf
2.
应收账
阿克斯
初学者
短裙
11
C1t
cl_exd
阿托斯
DDD
Thsdd。
http://www.abcd.com/files/abcd.pdf
因此,在这里,如果我使用solr查询搜索单词“solr word”,而不是只在文档中搜索,它还应该进入文件(文件路径)并搜索单词。 任何建议、帮助都会很有帮助。

我不知道

但也有可能通过另一条路线。您可以使用ApacheTika将pdf/doc文件提取为文本,然后可以为所述文本编制索引,使您能够“在”文档中进行搜索

示例实现:

pdf->tika

tika->pdf中的文本

pdf和文件路径->solr文档中的文本


search solr->如果搜索匹配文件的内容,则返回带有文件路径的文档

您的意思是说我必须使用tika为每个文件编制文档id索引,当搜索时,它将仅给出文件匹配项和该文件的相应路径。。我无法通过xml文件实现这一点,因为在我的例子中,我只希望下载文件的文件路径以及字段详细信息(如名称、描述和其他)也会显示出来……?您可以按照刚才描述的方式进行操作。我给出的是一个示例实现。您可以返回任意数量的字段,并返回任意数量的结果(假设您的文档与查询匹配)。以下是提取请求处理程序的用法:。您可以将文件本身上载到Solr。