Apache flink Flink电子病历程序失败 我认为,这是一个相当简单的FLink程序。源于卡夫卡流,应用过滤器,应用流程函数,应用平面图,并发送到Redis接收器。在我的dev box上的一个独立环境中本地运行它,没有问题。我正试图在AWS EMR上将其投入生产,我遵循了在EMR上运行Flink程序的指南。在我的第一次测试之后,我有一个GC开销限制超过了错误,所以我进行了调整以减少存储的数据量。我的下一次尝试程序运行了更长的时间,但最终失败了,没有像以前那样给出任何错误类型的指示

Apache flink Flink电子病历程序失败 我认为,这是一个相当简单的FLink程序。源于卡夫卡流,应用过滤器,应用流程函数,应用平面图,并发送到Redis接收器。在我的dev box上的一个独立环境中本地运行它,没有问题。我正试图在AWS EMR上将其投入生产,我遵循了在EMR上运行Flink程序的指南。在我的第一次测试之后,我有一个GC开销限制超过了错误,所以我进行了调整以减少存储的数据量。我的下一次尝试程序运行了更长的时间,但最终失败了,没有像以前那样给出任何错误类型的指示,apache-flink,emr,flink-streaming,Apache Flink,Emr,Flink Streaming,我不确定如何进行调试,我怀疑这些问题可能是在EMR上运行的副作用。据我所知,EMR控制台中的大多数监控指标都是无用的。如果有关系的话,我将运行该程序作为EMR中的一个步骤,我遵循的指南如下http://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-flink.html。该程序也被认为是一个始终向上的解决方案,基本上它将不断地从卡夫卡流中读取数据并处理数据(如果这有任何关系,不确定是否有一个不同的配置我应该用于始终向上的解决方案) 我很乐意提供任何

我不确定如何进行调试,我怀疑这些问题可能是在EMR上运行的副作用。据我所知,EMR控制台中的大多数监控指标都是无用的。如果有关系的话,我将运行该程序作为EMR中的一个步骤,我遵循的指南如下
http://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-flink.html
。该程序也被认为是一个始终向上的解决方案,基本上它将不断地从卡夫卡流中读取数据并处理数据(如果这有任何关系,不确定是否有一个不同的配置我应该用于始终向上的解决方案)

我很乐意提供任何必要的信息来帮助我把它投入生产


谢谢

您是说日志文件是空的,还是无法访问它们?FWIW,一般来说,我建议您在EMR上运行自己的Flink安装,而不是在AWS上运行,在这种情况下,Flink 1.3.2比1.3.1更稳定,因此可能值得一试。你可以看看系统指标:纱线在执行内存限制方面相当顽固;也许您的应用程序因为占用太多内存而被屏蔽。我建议调整taskmanager.memory.fraction(特别是当您使用RocksDB时,它会消耗堆外内存):您是否会无限期地保持状态?您可能需要添加计时器并清除不再需要的状态。是否可以尝试增加
taskmanager.heap.mb
类似于
[{“分类”:“flink conf”,“属性”:{“taskmanager.heap.mb”:“4000”,“taskmanager.memory.fraction”:“0.9”}]
创建EMR群集时