Lucene:通过向其添加IR信息来输出详细的数据
我需要处理一个数据库,以便将元数据信息(如td idf权重)添加到文档术语中 接下来,我需要创建具有相似性度量的文档对,如td idf余弦相似性等 我计划使用ApacheLucene完成这项任务。实际上,我对检索或运行查询不感兴趣,而是对数据进行索引并对其进行详细说明,以便生成具有上述文档对和相似性分数的输出文件。下一步是将这些结果传递给Weka分类器 我能轻松地和Lucene一起做吗? 谢谢试试看。将标有“Mahout”的位置替换为“Weka”。祝你好运Lucene:通过向其添加IR信息来输出详细的数据,lucene,full-text-indexing,Lucene,Full Text Indexing,我需要处理一个数据库,以便将元数据信息(如td idf权重)添加到文档术语中 接下来,我需要创建具有相似性度量的文档对,如td idf余弦相似性等 我计划使用ApacheLucene完成这项任务。实际上,我对检索或运行查询不感兴趣,而是对数据进行索引并对其进行详细说明,以便生成具有上述文档对和相似性分数的输出文件。下一步是将这些结果传递给Weka分类器 我能轻松地和Lucene一起做吗? 谢谢试试看。将标有“Mahout”的位置替换为“Weka”。祝你好运