Carrot2 识别合并气泡中的文档

Carrot2 识别合并气泡中的文档,carrot2,Carrot2,我是新来这里的,所以请容忍我。为了使用Aduna集群映射,我使用了32位的carrot2workbench。查看集群之间的关系很有帮助,但是如何在集合之间的重叠(合并气泡)中识别文档呢。例如,如果我有一个包含20个文档和另外30个文档的集群,以及重叠中的5个文档,如何找出这5个文档是什么?我还没有找到这样做的选择。如果不能做到这一点,它就不会非常有用。请帮忙。万分感谢 不幸的是,这是目前已知的Carrot2 Workbench的限制。由于各种原因,Aduna visualization和Work

我是新来这里的,所以请容忍我。为了使用Aduna集群映射,我使用了32位的carrot2workbench。查看集群之间的关系很有帮助,但是如何在集合之间的重叠(合并气泡)中识别文档呢。例如,如果我有一个包含20个文档和另外30个文档的集群,以及重叠中的5个文档,如何找出这5个文档是什么?我还没有找到这样做的选择。如果不能做到这一点,它就不会非常有用。请帮忙。万分感谢

不幸的是,这是目前已知的Carrot2 Workbench的限制。由于各种原因,Aduna visualization和Workbench的其余部分之间的交互是有限的,不可能检查两个或多个集群共享的文档

在某种程度上,我们希望用另一种类似功能的可视化来取代Aduna。出于这个原因,我们不打算绕过Aduna来实现全套交互


一些Aduna visualization的旧二进制文件可以从Maven存储库中获得,因此,如果您想自己使用它们和Carrot2群集,所有必需的资源都在那里。

谢谢您提供的信息。现在导出集群在这一点上也不可行吗?我想将选定的集群反馈到C2中,以便进行进一步的集群(这是搜索选项卡中的一个选项,但我没有看到导出群集的方法。谢谢。请参阅文件->另存为…菜单选项。但这只是文档ID,而不是像我上载用于群集的XML中那样的完整引用摘要集。我希望以相同的格式导出群集,以便可以输入所选的一个。)再次登录以进行进一步聚类。保存的XML还应包含您提交用于聚类的文档(除非您在“保存”对话框中取消选中相关复选框)。聚类按ID引用同一文件中的文档。