Python scipy稀疏矩阵:索引超出范围
我想在一个大型语料库上运行textrank(只是我的devenv使用了17K个句子) 因此,我使用了scipyPython scipy稀疏矩阵:索引超出范围,python,scipy,nlp,sparse-matrix,Python,Scipy,Nlp,Sparse Matrix,我想在一个大型语料库上运行textrank(只是我的devenv使用了17K个句子) 因此,我使用了scipydok_矩阵。然而,当将第一个值赋给我的稀疏矩阵(即,相似性矩阵[1][0])时,我得到了以下错误,尽管在pycharm调试中看到我的dok_矩阵的大小为17K×17K 索引器错误:行索引(1)超出范围 我做错了什么 def _score_generator(self, sentences, sentence_vectors): sentence_count = len(sen
dok_矩阵
。然而,当将第一个值赋给我的稀疏矩阵(即,相似性矩阵[1][0]
)时,我得到了以下错误,尽管在pycharm调试中看到我的dok_矩阵的大小为17K×17K
索引器错误:行索引(1)超出范围
我做错了什么
def _score_generator(self, sentences, sentence_vectors):
sentence_count = len(sentences)
similarity_matrix = dok_matrix((sentence_count, sentence_count), dtype=np.float32)
for i in range(len(sentences)):
for j in range(len(sentences)):
if i != j:
similarity_matrix[i][j] = cosine_similarity(sentence_vectors[i].reshape(1, 100), sentence_vectors[j].reshape(1, 100))[0, 0]
nx_graph = nx.from_scipy_sparse_matrix(similarity_matrix)
scores = nx.pagerank(nx_graph)
return scores
简单:
相似性矩阵[i,j]
我会把它放在这里,以防其他人会像我一样犯同样的认知错误