Apache spark 如何在spark中使用“会话化”命令对数据流进行会话化;“开始窗口”;及;“结束窗口”;事件

Apache spark 如何在spark中使用“会话化”命令对数据流进行会话化;“开始窗口”;及;“结束窗口”;事件,apache-spark,spark-streaming,Apache Spark,Spark Streaming,我正在处理流媒体管道,需要对事件流进行“会话化”。事件包含以下信息: { "customer_id": "2328323", "event_type" : "start_session", "event_timestamp": 1619050887, ... more data } 事件类型可以是“开始会话”或“结束会话”,这些事件是我的会话的边界。我一直在深入研究spa

我正在处理流媒体管道,需要对事件流进行“会话化”。事件包含以下信息:

{
   "customer_id": "2328323",
   "event_type" : "start_session",
   "event_timestamp": 1619050887,
   ... more data
}
事件类型可以是“开始会话”或“结束会话”,这些事件是我的会话的边界。我一直在深入研究spark文档,我了解如何通过时间戳、延迟到达数据的水印等进行会话,但找不到一种好方法来启动“start_session”事件的会话,并以“end_session”事件或一段不活动时间结束会话

提前谢谢