Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/298.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
将稀疏矩阵从Python传输到R_Python_R_Sparse Matrix_Text Analysis - Fatal编程技术网

将稀疏矩阵从Python传输到R

将稀疏矩阵从Python传输到R,python,r,sparse-matrix,text-analysis,Python,R,Sparse Matrix,Text Analysis,我正在用Python做一些文本分析工作。不幸的是,为了使用特定的包,我需要切换到R(不幸的是,该包无法在Python中轻松复制) 目前,文本被解析为二进制数,减少到约11000个二进制数的词汇表,然后存储为字典: {id1: {'bigrams':[(bigram1, count), (bigram2, count), ...]}, id2: {'bigrams': ...} 我需要把它放到R中的dgCMatrix中,其中的行是id1,id2。。。这些列是不同的二元图,因此一个单元格表示该i

我正在用Python做一些文本分析工作。不幸的是,为了使用特定的包,我需要切换到R(不幸的是,该包无法在Python中轻松复制)

目前,文本被解析为二进制数,减少到约11000个二进制数的词汇表,然后存储为字典:

{id1: {'bigrams':[(bigram1, count), (bigram2, count), ...]},
id2: {'bigrams': ...} 
我需要把它放到R中的dgCMatrix中,其中的行是id1,id2。。。这些列是不同的二元图,因此一个单元格表示该id二元图的“计数”


有什么建议吗?我曾考虑将其扩展为一个巨大的CSV,但由于内存限制,这似乎效率极低,而且可能不可行

您可以用MatrixMarket格式写出矩阵,然后从软件包中读取到R中吗?

一个实际值和较大数字的示例可能更有用。事实上,您希望我们在尝试编写代码之前做相当多的工作。也许你喜欢Python程序员比这个虚弱的程序员更好地掌握这个布局,但是你能提供更多的内容吗?这很有效!这不是一个超级内存效率的方法(据我所知),但我还是设法让它在我的电脑上运行的很好。希望它是相当的时间效率!哈哈!:)很高兴我能帮忙。