Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/list/4.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
有没有办法在Lucene中索引CHM文件?_Lucene_Chm - Fatal编程技术网

有没有办法在Lucene中索引CHM文件?

有没有办法在Lucene中索引CHM文件?,lucene,chm,Lucene,Chm,有谁能给我推荐一种方法,通过这种方法可以对chm文件进行索引,例如pdf的pdfbox。如果你在谈论文件,你可以用从文件中提取文本,然后以正常方式对其进行索引 如果您还需要索引其他文档格式,您可能会在中找到更好、更通用的解决方案 他们最近刚刚添加了一个CHM解析器(供参考:),它将在下一个版本中出现。小心点。可能有一个二进制和一个文本(.xml存储为.hhk)索引,它们可能不包含相同的内容。它似乎运行良好,.hhc问题已经解决。Thnx againApache Tika更常用于Lucene,我只

有谁能给我推荐一种方法,通过这种方法可以对chm文件进行索引,例如pdf的pdfbox。

如果你在谈论文件,你可以用从文件中提取文本,然后以正常方式对其进行索引

如果您还需要索引其他文档格式,您可能会在中找到更好、更通用的解决方案


他们最近刚刚添加了一个CHM解析器(供参考:),它将在下一个版本中出现。

小心点。可能有一个二进制和一个文本(.xml存储为.hhk)索引,它们可能不包含相同的内容。它似乎运行良好,.hhc问题已经解决。Thnx againApache Tika更常用于Lucene,我只是不知道他们对CHM的支持。所以,请接受死亡的回答。