Java 使用Json模式的Json记录边界

Java 使用Json模式的Json记录边界,java,json,hadoop,Java,Json,Hadoop,基本上,我正在hadoop中构建一个CustomInput格式来读取Json输入文件(Java)。 有些文档以数组(“{”)开头有些文档会从记录标识符开始。我只是想用一个模式文件来构建一个可以识别记录边界的东西,这个模式文件告诉我们如何读取json文档,或者说记录从哪里开始。到目前为止,验证整个json文档对我来说并不合适。任何输入都将不胜感激。s以[…]开始和结束。对象以{…}开始和结束。你是说包含数组的文档应该被视为多条记录,而只有一个对象的文档应该被视为一条记录吗?不。我不是这么说。重点是

基本上,我正在hadoop中构建一个CustomInput格式来读取Json输入文件(Java)。
有些文档以数组(“{”)开头有些文档会从记录标识符开始。我只是想用一个模式文件来构建一个可以识别记录边界的东西,这个模式文件告诉我们如何读取json文档,或者说记录从哪里开始。到目前为止,验证整个json文档对我来说并不合适。任何输入都将不胜感激。

s以
[…]
开始和结束。对象以
{…}开始和结束
。你是说包含数组的文档应该被视为多条记录,而只有一个对象的文档应该被视为一条记录吗?不。我不是这么说。重点是如何解释一条记录。我的意思是有些记录没有文档的记录标识符,有些记录可能有。比如id{}。假设系统不知道json文件会是什么样子。所以我需要考虑一个逻辑来识别记录布局并处理每个json记录。