Pandas 如何读入扩展名为.snappy.parquet的文件

Pandas 如何读入扩展名为.snappy.parquet的文件,pandas,parquet,snappy,Pandas,Parquet,Snappy,我需要将扩展名为.snappy.parquet的文件读入我的Jupyter笔记本,并将其转换为pandas dataframe import pyarrow.parquet as pq filename = "part-00000-tid-2430471264870034304-5b82f32f-de64-40fb-86c0-fb7df2558985-1598426-1-c000.snappy.parquet" df = pq.read_table(filename).to_pandas()

我需要将扩展名为.snappy.parquet的文件读入我的Jupyter笔记本,并将其转换为pandas dataframe

import pyarrow.parquet as pq

filename = "part-00000-tid-2430471264870034304-5b82f32f-de64-40fb-86c0-fb7df2558985-1598426-1-c000.snappy.parquet" 
df = pq.read_table(filename).to_pandas()``` 

The error is: ```ArrowNotImplementedError: lists with structs are not supported```

截至2019-11-30,Apache Arrow不支持类型为
List[Struct[…]]
(即列表和结构的混合嵌套)的列。正如在另一个回答中提到的,相关问题是

要仍然读取此文件,可以通过向
pyarrow.parquet.read\u table
提供
columns
参数来读取所有支持类型的列。要找出哪些列具有复杂的嵌套类型,请使用
pyarrow.parquet.ParquetFile(filename.schema
查看文件的架构