Python 如何将scipy稀疏矩阵保存到拼花地板文件中

Python 如何将scipy稀疏矩阵保存到拼花地板文件中,python,io,scipy,sparse-matrix,parquet,Python,Io,Scipy,Sparse Matrix,Parquet,我试图重现Netflix最近在产品Vectorflow中提到的设置 他们正在使用配置单元中的拼花文件作为数据源。我想用scipy的稀疏矩阵生成一些假数据。如何将这样的矩阵保存到拼花地板文件中?您可以使用Apache Arrow(Python包名为pyarrow)来编写拼花地板文件: 有一些方便的函数来存储pandas.DataFrames,对于scipy稀疏矩阵,您可以使用其中一些函数,但需要对其进行一些调整 使用ApacheParquet的重要一点是它是一种柱状的、类似表格的格式,即它需要一个

我试图重现Netflix最近在产品Vectorflow中提到的设置

他们正在使用配置单元中的拼花文件作为数据源。我想用scipy的稀疏矩阵生成一些假数据。如何将这样的矩阵保存到拼花地板文件中?

您可以使用Apache Arrow(Python包名为
pyarrow
)来编写拼花地板文件:

有一些方便的函数来存储pandas.DataFrames,对于scipy稀疏矩阵,您可以使用其中一些函数,但需要对其进行一些调整


使用ApacheParquet的重要一点是它是一种柱状的、类似表格的格式,即它需要一个数组字典。你必须以这种形式提交矩阵。这将在一定程度上取决于Vectorflow对数据的期望。

您找到解决方案了吗?@LeoGallucci没有,我没有。您的意思是稍微调整一下?有没有一个例子说明如何将scipy稀疏矩阵写入拼花地板?