在Java中从Web提取数据并将其转换为有意义的信息

在Java中从Web提取数据并将其转换为有意义的信息,java,data-mining,Java,Data Mining,我正在研究一个从网络中提取数据并将其转换成有意义的东西以便外行能够理解的系统 但我甚至找不到起点 您能给我一些指导,告诉我从哪里开始,java中的哪些工具可以帮助我设计和开发这个系统 谢谢 您有两个问题:从web提取数据,并将其转换为有意义的内容。第一个可以使用 然后是转换数据的部分。你需要非常具体地考虑 所需的数据类型 您希望存储它的方式 您希望应用于它的挖掘类型 比如说, 霍格莫德人民的天气信息 具有最低/最高温度、湿度和雨/雪信息等的数据库 根据过去40年的天气预测降雨量 如果可以的话,试

我正在研究一个从网络中提取数据并将其转换成有意义的东西以便外行能够理解的系统

但我甚至找不到起点

您能给我一些指导,告诉我从哪里开始,java中的哪些工具可以帮助我设计和开发这个系统


谢谢

您有两个问题:从web提取数据,并将其转换为有意义的内容。第一个可以使用

然后是转换数据的部分。你需要非常具体地考虑

  • 所需的数据类型
  • 您希望存储它的方式
  • 您希望应用于它的挖掘类型
  • 比如说,

  • 霍格莫德人民的天气信息
  • 具有最低/最高温度、湿度和雨/雪信息等的数据库
  • 根据过去40年的天气预测降雨量
    如果可以的话,试着提供一些上下文。

    谢谢你的回复,布格曼,我可以给你举个例子,假设我必须获得某个特定地区将发生的最新事件。因此,我应该获得主办最新即将举行的活动的网站的列表,从那里获取数据,一些如何将数据与活动时间联系起来,等等,然后以一种有意义的信息的形式向最终用户表示。你现在还不应该接受答案,因为这并不能解决你的问题(而且我认为人们不太可能关心回答一个“被接受的”问题)。此外,我不理解“假设我必须获得最新的事件”,也不理解“假设我必须获得最新的事件”——即将到来的事件。我只是描述了流程,但问题是“我知道该怎么做,但我不知道怎么做”所以你能给我推荐一些工具来帮助我实现我想要的吗?你可以使用apache solr()进行挖掘部分。它有很好的教程。我从来没有做过来自某个特定区域的数据,所以我不能告诉你。这意味着solr和我的数据直接形成网站?