Mahout CSV到SEQ用于文本矢量化

Mahout CSV到SEQ用于文本矢量化,csv,vectorization,mahout,Csv,Vectorization,Mahout,我有一个很大的CSV文件,其中每一行都以文本格式组成(id、说明)。我想使用“seq2sparse”将每一行转换为一个向量,然后运行“rowsimilarity”生成文本相似性结果 问题是我需要以某种方式将CSV文件转换为SEQ以使用“seq2sparse”,而现有方法“seqdirectory”采用文本文件目录,而不是CSV文件。无论如何,要完成这一点

我有一个很大的CSV文件,其中每一行都以文本格式组成(id、说明)。我想使用“seq2sparse”将每一行转换为一个向量,然后运行“rowsimilarity”生成文本相似性结果

问题是我需要以某种方式将CSV文件转换为SEQ以使用“seq2sparse”,而现有方法“seqdirectory”采用文本文件目录,而不是CSV文件。无论如何,要完成这一点