Java 如何提高JSON解析的性能_Java_Json_Performance_Parallel Processing

Java 如何提高JSON解析的性能

java json performance parallel-processing

Java 如何提高JSON解析的性能,java,json,performance,parallel-processing,Java,Json,Performance,Parallel Processing,我有一个场景，用户要上传一个zip文件。这个zip文件可以有4999个json文件，每个json文件可以有4999个节点，我正在解析和创建对象。最后，我将它们插入数据库中。当我测试这个场景时，我花了30-50分钟来解析我在哪里寻找建议我想并行读取JSON文件：假设我有一批100个JSonfile，那么我可以有50个线程并行运行每个线程将负责解析JSON文件，这可能会导致另一个性能瓶颈，因为我们要解析4999个节点。所以我想一次再读取100个节点，这将再次导致50个子线程因此，系统中总

我有一个场景，用户要上传一个zip文件。这个zip文件可以有4999个json文件，每个json文件可以有4999个节点，我正在解析和创建对象。最后，我将它们插入数据库中。当我测试这个场景时，我花了30-50分钟来解析

我在哪里寻找建议

我想并行读取JSON文件：假设我有一批100个JSonfile，那么我可以有50个线程并行运行

每个线程将负责解析JSON文件，这可能会导致另一个性能瓶颈，因为我们要解析4999个节点。所以我想一次再读取100个节点，这将再次导致50个子线程

因此，系统中总共将有2500个线程，但应该有助于并行执行大约25000000个顺序操作

让我知道这种方法听起来是否合适？

您所描述的不应该花费太多时间（30-50分钟来解析），而且一个具有~5k节点的json文件相对较小。在大规模插入期间，瓶颈将出现在数据库中，尤其是在字段上有索引的情况下

因此，我建议：

不要把时间浪费在线程上——在您的情况下，解包和解析JSON应该很快，重点放在bath插入上并正确地完成：1000+批处理队列和之后手动提交

导入前禁用索引，尤其是全文索引，导入后启用（+重新索引）

我认为，性能问题可能来自：

JSON解析&创建对象

向数据库插入数据：如果插入多次，性能会降低很多

如果你运行2500个线程，如果你没有太多的CPU，这可能是无效的，因为开销可能会增加。根据您的硬件配置，您可以定义线程数

要将数据插入数据库，我建议按以下步骤操作：

在JSON解析和创建对象之后，每个线程都将对象放入CSV文件中
完成后，尝试将CSV导入数据库