在Python中使用不同数组堆叠稀疏矩阵

在Python中使用不同数组堆叠稀疏矩阵,python,bigdata,sparse-matrix,Python,Bigdata,Sparse Matrix,我在SparFrame变量中有一些nlp数据,每个变量有N列。我需要堆叠这些变量来创建MxN csv稀疏文件。 我尝试使用sparse.csr_矩阵转换sparse.aframe变量,然后使用vstack堆叠生成的向量行。但是,由sparse.csr_矩阵创建的矩阵的形状是(1,K),每个矩阵的K都不同(简单地说,它是具有非零参数的最高列索引),这会导致vstack失败 例如,在将两个SparFrame变量转换为10列后,我得到: IN[] print(A) OUT[] (0,

我在SparFrame变量中有一些nlp数据,每个变量有N列。我需要堆叠这些变量来创建MxN csv稀疏文件。 我尝试使用sparse.csr_矩阵转换sparse.aframe变量,然后使用vstack堆叠生成的向量行。但是,由sparse.csr_矩阵创建的矩阵的形状是(1,K),每个矩阵的K都不同(简单地说,它是具有非零参数的最高列索引),这会导致vstack失败

例如,在将两个SparFrame变量转换为10列后,我得到:

  IN[]    print(A)
 OUT[]    (0, 0)    1
          (0, 3)    4

  IN[]    print(B)
 OUT[]    (0, 1)    1

  IN[]    C = vstack((A,B),format='csr')
我得到
值错误:轴1的尺寸不兼容

是否简单地将我的M 1维稀疏帧/稀疏矩阵附加到MxN稀疏mtx/稀疏csv文件


谢谢

请提供一个我们可以用来重现问题的具体示例。你已经很好地描述了这个问题,但是一个具体的例子会让更多的人明白这一点。还有,SparaFrame的来源是什么?R有这样一个类型,但它不是Python的本机类型。请澄清?请提供一个我们可以用来重现问题的具体例子。你已经很好地描述了这个问题,但是一个具体的例子会让更多的人明白这一点。还有,SparaFrame的来源是什么?R有这样一个类型,但它不是Python的本机类型。请澄清一下?