Java 基于spark中以前记录的标签数据

Java 基于spark中以前记录的标签数据,java,spring,apache-spark,java-8,Java,Spring,Apache Spark,Java 8,我正致力于将Spark和MySQL合并到Java中进行数据处理,这是一个确定犯罪行为重复性的小练习。我已经能够设置好一切,但我的头撞在墙上,以得到以下逻辑工作 给定一个包含以下信息的表格-我希望能够标记以下内容,并举例说明该项发生的频率。这是在该人员进行社区服务时计算得出的: 无犯罪史:如果此人之前没有犯罪史;实例计数为零 良好的历史记录:如果此人没有打架史,并且在过去90天内做过社区服务;过去90天内通信服务的实例计数 战斗历史:如果该人在其历史中至少有一次战斗;战斗次数 鉴于: 事故发生

我正致力于将Spark和MySQL合并到Java中进行数据处理,这是一个确定犯罪行为重复性的小练习。我已经能够设置好一切,但我的头撞在墙上,以得到以下逻辑工作

给定一个包含以下信息的表格-我希望能够标记以下内容,并举例说明该项发生的频率。这是在该人员进行社区服务时计算得出的:

  • 无犯罪史:如果此人之前没有犯罪史;实例计数为零
  • 良好的历史记录:如果此人没有打架史,并且在过去90天内做过社区服务;过去90天内通信服务的实例计数
  • 战斗历史:如果该人在其历史中至少有一次战斗;战斗次数
鉴于:

事故发生日期 当事人 事件类型 2020-02-01 罗尼G。 搏斗 2020-02-03 罗尼G。 搏斗 2020-02-10 斯特拉B。 通信服务 2020-02-14 罗尼G。 通信服务 2020-03-15 斯特拉B。 通信服务 2020-05-01 斯特拉B。 通信服务 2020-10-01 斯特拉B。 通信服务