Hadoop oozie工作流抛出套接字错误,但在10分钟后提交工作流两次

Hadoop oozie工作流抛出套接字错误,但在10分钟后提交工作流两次,hadoop,oozie,oozie-workflow,Hadoop,Oozie,Oozie Workflow,我面临着非常奇怪的问题。我有一个工作流xml,它包含20个fork-join节点,每个节点包含4-8个操作。当我提交这个工作流时,它会等待5-6分钟,然后抛出 "Error: IO_ERROR : java.net.SocketException: Connection reset" 但实际上,在后台发生的是它在10分钟后提交一个工作流&12分钟后提交另一个工作流。所以它会触发两次 我尝试验证我的xml&它返回“OK”。由于它没有返回工作流,我无法进行调试。老实说,我甚至不

我面临着非常奇怪的问题。我有一个工作流xml,它包含20个fork-join节点,每个节点包含4-8个操作。当我提交这个工作流时,它会等待5-6分钟,然后抛出

"Error: IO_ERROR : java.net.SocketException: Connection reset"
但实际上,在后台发生的是它在10分钟后提交一个工作流&12分钟后提交另一个工作流。所以它会触发两次

我尝试验证我的xml&它返回“OK”。由于它没有返回工作流,我无法进行调试。老实说,我甚至不知道从哪里开始调试


我有类似的工作流程和较小的叉子(6),他们都工作得很好。但是不确定为什么这一个会引起所有的麻烦。

上面的错误看起来更像是客户端的错误。我认为最好是检查服务器日志

oozie job -oozie http://localhost:11000 -info <wfid>
oozie job -oozie http://localhost:11000 -log <wfid>

这些日志没有提供任何有意义的信息。因此,我将工作流文件拆分为2个XML。我从第一个工作流的最后一个操作调用了第二个工作流。它运行良好,没有任何问题。

谢谢您的建议。实际上,我在trigger命令中使用了FQN&它的有效url也用于其他工作流。不过,我会检查您建议的日志,并进行更新。
oozie job -oozie http://node_name@domain:11000/oozie -config xxxx -run