Vectorization 如何用从培训数据创建的文档术语矩阵表示测试集中的文档?(潜在语义索引)

Vectorization 如何用从培训数据创建的文档术语矩阵表示测试集中的文档?(潜在语义索引),vectorization,text-mining,data-representation,term-document-matrix,sentence-similarity,Vectorization,Text Mining,Data Representation,Term Document Matrix,Sentence Similarity,我根据文档的训练集建立了文档分类模型。分类是通过每个文档的向量表示完成的,即文档术语矩阵中的一行。然后,为了测试模型,我需要测试集中每个文档的表示。既然不是每个术语都包含在培训集中(因此是文档术语矩阵),我该怎么做

我根据文档的训练集建立了文档分类模型。分类是通过每个文档的向量表示完成的,即文档术语矩阵中的一行。然后,为了测试模型,我需要测试集中每个文档的表示。既然不是每个术语都包含在培训集中(因此是文档术语矩阵),我该怎么做