Java 巨大的Json解析器
我有一个用Java制作的自定义解析器,我想将一个3,6 GB的Json导出到一个Sql Oracle数据库中。对于8MB的Json示例,导入工作正常。但是当我尝试解析整个3,6 GB JSON时,出现了一些内存问题,即java.lang.OutOfMemoryError 我已经使用-Xmx5000m为此分配了5gb的内存。我的笔记本电脑内存充足 正如你所看到的,我还有记忆。发生此错误是因为CPU的原因吗 更新: Json表示来自自由代码营的数据: 数据如下所示: [ { “名称”:“航路点:向HTML元素问好”, “完成日期”:1445854025698, “解决方案”:“Hello World\n” } ] 正如我所说的,我用8MB的Json样本对相同的数据进行了解析,结果成功了。那么代码真的是问题所在吗 这里有一些代码Java 巨大的Json解析器,java,json,Java,Json,我有一个用Java制作的自定义解析器,我想将一个3,6 GB的Json导出到一个Sql Oracle数据库中。对于8MB的Json示例,导入工作正常。但是当我尝试解析整个3,6 GB JSON时,出现了一些内存问题,即java.lang.OutOfMemoryError 我已经使用-Xmx5000m为此分配了5gb的内存。我的笔记本电脑内存充足 正如你所看到的,我还有记忆。发生此错误是因为CPU的原因吗 更新: Json表示来自自由代码营的数据: 数据如下所示: [ { “名称”:“航路点:
enter code here
public class MainParser {
public static void main(String[] args) {
//Date time;
try {
BufferedReader br = new BufferedReader(
new FileReader("output.json")); //destination to json here
Gson gson = new Gson();
Type collectionType = new TypeToken<List<List<Tasks>>>() {
}.getType();
List<List<Tasks>> details = gson.fromJson(br, collectionType);
DBConnect connection = new DBConnect("STUDENT","student");
connection.connect();
for (int person=0;person<details.size();person++)
{
for (int task = 0; task < details.get(person).size(); task++)
{
connection.insert_query(person + 1,
task + 1,
details.get(person).get(task).getName(),
(details.get(person).get(task).getCompletedDate()/1000),
details.get(person).get(task).getSolution());
}
}
} catch (IOException e) {
e.printStackTrace();
} catch (SQLException e) {
e.printStackTrace();
}
}
}
解析JSON(或者其他任何东西)不会占用与原始文件大小相同的内存
表示对象的每个JSON字符串块都将成为一个对象,为已加载的JSON添加内存。如果您使用某种流解析它,您仍然会添加内存,但要少得多(您不会在内存中保存整个3.6GB文件)
尽管如此,对象需要比字符串更多的内存来表示。如果您有一个数组,它可能被解析为一个列表,那么该列表就有开销。将这个开销乘以JSON中的实例(相当多,在一个3.6GB的文件中),最终得到的结果远远超过了3.6GB的内存
但是如果您想将其解析为流,并在其进行时处理每个记录,然后丢弃它,您可以这样做。在这两种情况下,使用流都需要一个组件来解析JSON并让您处理每个解析的对象。如果你知道它的结构,你自己写一本可能会更容易
希望有帮助。请参阅
当无法将整个模型加载到内存中时,使用此选项。您需要使用基于事件/流式JSON解析器。其思想是,解析器不是一次性解析整个JSON文件并将其保存在内存中,而是在每个重要语法单元的开始和结束处发出“事件”。然后编写代码来处理这些事件,并将这些信息进行附加和组装,然后(在您的情况下)将相应的记录插入数据库 以下是开始阅读Oracle的JSON流API的一些地方:
流式处理
方法解析json:谢谢,这很有帮助,我将修改解析这个JSON的方法。谢谢,我会检查一下。
enter code here
public void insert_query(int person_id, int task_id, String taskName, double date, String solution) throws SQLException {
Statement stmt = conn.createStatement();
try {
String query = "INSERT INTO FreeCodeCamp VALUES(?,?,?,?,?)";
PreparedStatement ps = conn.prepareStatement(query);
ps.setInt(1,person_id);
ps.setInt(2,task_id);
ps.setString(3,taskName);
ps.setDate(4,null);
ps.setString(5,solution);
/*stmt.executeUpdate("INSERT INTO FreeCodeCamp VALUES("
+ person_id + ","
+ task_id + ","
+ "'" + taskName + "',"
+ "TO_TIMESTAMP(unix_ts_to_date(" + date + "),'YYYY-MM-DD HH24:MI:SS'),"
+ "'" + solution + "')");
stmt.close();*/
ps.execute();
ps.close();
} catch (SQLException e) {
e.printStackTrace();
}