Python 如何规范vaex中的json列?

Python 如何规范vaex中的json列?,python,pandas,vaex,Python,Pandas,Vaex,给定一个嵌套的json,有没有办法在vaex中加载并展平它 这是在熊猫身上实现的一种方法: import pandas as pd from pandas.io.json import json_normalize df = pd.read_json(input_file) df = pd.concat([df, json_normalize(df['eventData'])], axis=1) json可以是这样的: [ {"timestamp":..., "id": ..., "even

给定一个嵌套的json,有没有办法在vaex中加载并展平它

这是在熊猫身上实现的一种方法:

import pandas as pd
from pandas.io.json import json_normalize

df = pd.read_json(input_file)
df = pd.concat([df, json_normalize(df['eventData'])], axis=1)
json可以是这样的:

[
{"timestamp":..., "id": ..., "eventData": {"type":..., "name":...}},
{"timestamp":..., "id": ..., "eventData": {"type":..., "name":...}}
]

数据帧的列应该是“timestamp”、“id”、“type”和“name”。

如果您稍微转换数据,您可能可以使用
vaex。从_dict()
,不?@AMC不确定您的意思
from_dict
需要一个字典,而不是
df['eventData']
所指的字典列表。在pandas中,我也可以使用
from_records
concat
axis=1
(即
df=pd.concat([pd.read_json(f),pd.DataFrame.from_records(df['eventData']],axis=1)
),但这些在vaex中都不可用。你是否已经弄明白了?如果你已经可以用pandas来做这件事,为什么不直接做
vaex\u df=vaex.from\u pandas(pandas\u df)
?如果你稍微变换一下数据,你可能可以使用
vaex.from\u dict()
,不?@AMC不太清楚你的意思
from_dict
需要一个字典,而不是
df['eventData']
所指的字典列表。在pandas中,我也可以使用
from_records
concat
axis=1
(即
df=pd.concat([pd.read_json(f),pd.DataFrame.from_records(df['eventData']],axis=1)
),但这些在vaex中都不可用。你是否已经弄明白了?如果你已经可以用pandas来做这件事,为什么不直接从熊猫(pandas\u df)vaex\u df=vaex.from\u pandas(pandas\u df)?