在Python中使用不同数组堆叠稀疏矩阵
我在SparFrame变量中有一些nlp数据,每个变量有N列。我需要堆叠这些变量来创建MxN csv稀疏文件。 我尝试使用sparse.csr_矩阵转换sparse.aframe变量,然后使用vstack堆叠生成的向量行。但是,由sparse.csr_矩阵创建的矩阵的形状是(1,K),每个矩阵的K都不同(简单地说,它是具有非零参数的最高列索引),这会导致vstack失败 例如,在将两个SparFrame变量转换为10列后,我得到:在Python中使用不同数组堆叠稀疏矩阵,python,bigdata,sparse-matrix,Python,Bigdata,Sparse Matrix,我在SparFrame变量中有一些nlp数据,每个变量有N列。我需要堆叠这些变量来创建MxN csv稀疏文件。 我尝试使用sparse.csr_矩阵转换sparse.aframe变量,然后使用vstack堆叠生成的向量行。但是,由sparse.csr_矩阵创建的矩阵的形状是(1,K),每个矩阵的K都不同(简单地说,它是具有非零参数的最高列索引),这会导致vstack失败 例如,在将两个SparFrame变量转换为10列后,我得到: IN[] print(A) OUT[] (0,
IN[] print(A)
OUT[] (0, 0) 1
(0, 3) 4
IN[] print(B)
OUT[] (0, 1) 1
IN[] C = vstack((A,B),format='csr')
我得到值错误:轴1的尺寸不兼容
是否简单地将我的M 1维稀疏帧/稀疏矩阵附加到MxN稀疏mtx/稀疏csv文件
谢谢请提供一个我们可以用来重现问题的具体示例。你已经很好地描述了这个问题,但是一个具体的例子会让更多的人明白这一点。还有,SparaFrame的来源是什么?R有这样一个类型,但它不是Python的本机类型。请澄清?请提供一个我们可以用来重现问题的具体例子。你已经很好地描述了这个问题,但是一个具体的例子会让更多的人明白这一点。还有,SparaFrame的来源是什么?R有这样一个类型,但它不是Python的本机类型。请澄清一下?