Java 在提供的网页上创建知识库作为提要

Java 在提供的网页上创建知识库作为提要,java,webpage,Java,Webpage,我对我最后一年的部分项目有一些问题。我们正在实施一个剽窃检测框架。我在做网络资源检测部分。目前我的互联网搜索算法已经完成。但我需要增强它,以便减少互联网搜索延迟 我的想法是这样的: 第一个用户被提示插入一些web链接作为系统的初始知识提要。 然后它在互联网上爬行并扩展它的知识 一旦获取了知识,系统就不需要再次查询internet。有人能为我提供一些实施指南吗?我们正在使用Java。但是任何抽象的细节都肯定会对我有所帮助。如果服务器端编程是由您亲自完成的,那么您可以管理一个选项卡,该选项卡的数据库

我对我最后一年的部分项目有一些问题。我们正在实施一个剽窃检测框架。我在做网络资源检测部分。目前我的互联网搜索算法已经完成。但我需要增强它,以便减少互联网搜索延迟

我的想法是这样的:

第一个用户被提示插入一些web链接作为系统的初始知识提要。 然后它在互联网上爬行并扩展它的知识


一旦获取了知识,系统就不需要再次查询internet。有人能为我提供一些实施指南吗?我们正在使用Java。但是任何抽象的细节都肯定会对我有所帮助。

如果服务器端编程是由您亲自完成的,那么您可以管理一个选项卡,该选项卡的数据库中有一个布尔值,它显示了这些细节之前是否被读取过。每次客户端连接到服务器时,它都会首先检查布尔值,如果布尔值设置为false,则表示需要向客户端发送更新,否则不会发送更新


每次客户端从服务器下载任何数据时,布尔值都将变为true,而每次更新数据库时,布尔值都将变为false。我不太确定我是否理解您的要求。无论如何:

  • 如果您正在寻找Java Web爬虫,那么我建议您阅读

  • 如果您正在寻找Java库来构建知识库(KB),那么它实际上取决于(1)您的知识库应该具有什么样的属性,以及(2)您期望知识库具有什么样的推理能力。一种选择是使用,但这需要您熟悉语义Web形式

祝你好运