在Python中将JSON转换为换行分隔的JSON_Python_Json_Google Cloud Platform_Google Bigquery

在Python中将JSON转换为换行分隔的JSON

python json google-cloud-platform google-bigquery

在Python中将JSON转换为换行分隔的JSON,python,json,google-cloud-platform,google-bigquery,Python,Json,Google Cloud Platform,Google Bigquery,我的目标是将JSON文件转换成一种可以用Python从云存储上传到BigQuery（）的格式我已尝试使用包进行转换，但收到以下错误 JSONDecodeError: Expecting value or ']': line 2 column 1 (char 5) 有人能解决这个问题吗以下是示例JSON代码： [{ "key01": "value01", "key02": "value02", ... "keyN": "valueN" }, { "ke

我的目标是将JSON文件转换成一种可以用Python从云存储上传到BigQuery（）的格式

我已尝试使用包进行转换，但收到以下错误

JSONDecodeError: Expecting value or ']': line 2 column 1 (char 5)

有人能解决这个问题吗

以下是示例JSON代码：

[{
    "key01": "value01",
    "key02": "value02",
    ...
    "keyN": "valueN"
},
{
    "key01": "value01",
    "key02": "value02",
    ...
    "keyN": "valueN"
},
{
    "key01": "value01",
    "key02": "value02",
    ...
    "keyN": "valueN"
}
]

下面是现有的python脚本：

with nlj.open(url_samplejson, json_lib = "simplejson") as src_:
    with nlj.open(url_convertedjson, "w") as dst_:
        for line_ in src_:
            dst_.write(line_)

如果您愿意退出Python，请使用

jq

：

$ cat a.json 
[{
    "key01": "value01",
    "key02": "value02",
    "keyN": "valueN"
},
{
    "key01": "value01",
    "key02": "value02",
    "keyN": "valueN"
},
{
    "key01": "value01",
    "key02": "value02",
    "keyN": "valueN"
}
]


$ cat a.json | jq -c '.[]'
{"key01":"value01","key02":"value02","keyN":"valueN"}
{"key01":"value01","key02":"value02","keyN":"valueN"}
{"key01":"value01","key02":"value02","keyN":"valueN"}

我使用的迭代器是

'.[]'

遍历数组，而

-c

将每个JSON对象放在一行上

资源：

jq

json

import json
from io import StringIO
in_json = StringIO("""[{
    "key01": "value01",
    "key02": "value02",

    "keyN": "valueN"
},
{
    "key01": "value01",
    "key02": "value02",

    "keyN": "valueN"
},
{
    "key01": "value01",
    "key02": "value02",

    "keyN": "valueN"
}
]""")

result = [json.dumps(record) for record in json.load(in_json)]  # the only significant line to convert the JSON to the desired format

print('\n'.join(result))

{"key01": "value01", "key02": "value02", "keyN": "valueN"}
{"key01": "value01", "key02": "value02", "keyN": "valueN"}
{"key01": "value01", "key02": "value02", "keyN": "valueN"}

StringIO

print

这将获取一个JSON文件并转换为ND-JSON文件。

import json

with open("results-20190312-113458.json", "r") as read_file:
    data = json.load(read_file)
result = [json.dumps(record) for record in data]
with open('nd-proceesed.json', 'w') as obj:
    for i in result:
        obj.write(i+'\n')

jq

node jq

data=df.To_dict（'records'）

output=open（'test.json'，'w'）

output.write（'\n'.join（[json.dumps（record））

output.close（）