如何使用pandas读取Python中包含json字符串的.jlog?
我在.jlog文件中有一个json字符串,希望使用python将该文件作为包含列的df读取 我的代码如下:如何使用pandas读取Python中包含json字符串的.jlog?,python,json,pandas,dataframe,Python,Json,Pandas,Dataframe,我在.jlog文件中有一个json字符串,希望使用python将该文件作为包含列的df读取 我的代码如下: import pandas as pd df_weblogs=pd.read_json('C:/Users/me/my_file.jlog', orient='columns') 这给了我一个错误 --------------------------------------------------------------------------- MemoryError
import pandas as pd
df_weblogs=pd.read_json('C:/Users/me/my_file.jlog', orient='columns')
这给了我一个错误
---------------------------------------------------------------------------
MemoryError Traceback (most recent call last)
<ipython-input-20-4085b33a005e> in <module>()
----> 1 df_weblogs=pd.read_json('C:/Users/me/my_file.jlog', orient='columns')
2 df_weblogs.head(5)
~\Anaconda\lib\site-packages\pandas\io\json\json.py in read_json(path_or_buf, orient, typ, dtype, convert_axes, convert_dates, keep_default_dates, numpy, precise_float, date_unit, encoding, lines, chunksize, compression)
414 keep_default_dates=keep_default_dates, numpy=numpy,
415 precise_float=precise_float, date_unit=date_unit, encoding=encoding,
--> 416 lines=lines, chunksize=chunksize, compression=compression,
417 )
418
~\Anaconda\lib\site-packages\pandas\io\json\json.py in __init__(self, filepath_or_buffer, orient, typ, dtype, convert_axes, convert_dates, keep_default_dates, numpy, precise_float, date_unit, encoding, lines, chunksize, compression)
464
465 data = self._get_data_from_filepath(filepath_or_buffer)
--> 466 self.data = self._preprocess_data(data)
467
468 def _preprocess_data(self, data):
~\Anaconda\lib\site-packages\pandas\io\json\json.py in _preprocess_data(self, data)
475 """
476 if hasattr(data, 'read') and not self.chunksize:
--> 477 data = data.read()
478 if not hasattr(data, 'read') and self.chunksize:
479 data = StringIO(data)
MemoryError:
---------------------------------------------------------------------------
MemoryError回溯(上次最近调用)
在()
---->1 df_weblogs=pd.read_json('C:/Users/me/my_file.jlog',orient='columns')
2个df_网络日志。标题(5)
读取json格式的~\Anaconda\lib\site packages\pandas\io\json\json.py(路径、方向、类型、数据类型、转换轴、转换日期、保留默认日期、numpy、精确浮点、日期单位、编码、行、块大小、压缩)
414保留默认日期=保留默认日期,numpy=numpy,
415精确浮点=精确浮点,日期单位=日期单位,编码=编码,
-->416行=行,chunksize=chunksize,压缩=压缩,
417 )
418
~\Anaconda\lib\site packages\pandas\io\json\json.py in\uuuuu init\uuuu(self、filepath\u或\u buffer、orient、typ、dtype、convert\u axes、convert\u dates、keep\u default\u dates、numpy、precision\u float、date\u unit、编码、行、chunksize、压缩)
464
465 data=self.\u从文件路径(文件路径或缓冲区)获取数据
-->466 self.data=self.\u预处理\u数据(数据)
467
468定义预处理数据(自身,数据):
数据预处理中的~\Anaconda\lib\site packages\pandas\io\json\json.py(self,data)
475 """
476如果hasattr(数据“读取”)而不是self.chunksize:
-->477 data=data.read()
478如果不是hasattr(数据“读取”)和self.chunksize:
479数据=字符串IO(数据)
记忆错误:
如何正确读取它?请给我们完整的堆栈跟踪。我添加了完整的堆栈跟踪。jlog文件是什么样子的?您可以添加一个示例吗?