将Scala countvectorizer输出转换为libsvm格式

将Scala countvectorizer输出转换为libsvm格式,scala,format,libsvm,countvectorizer,Scala,Format,Libsvm,Countvectorizer,大家好,我可以推荐一个从scala countvectorizer输出([label,(NVCAble,[i1,i2,],[c1,c2,…]))到libsvm格式的映射:(label,:…) 如果您将输入作为字符串,首先,我不确定从何处拆分字段 或者,是否有用于此的scala实用程序? 谢谢 kvd我找到了答案。countVectorizer输出可以转换为sparseVecor数据类型,该数据类型具有[size、[index]、[value]]。索引和值数组可以压缩并以libsvm格式输出 va

大家好,我可以推荐一个从scala countvectorizer输出([label,(NVCAble,[i1,i2,],[c1,c2,…]))到libsvm格式的映射:(label,:…)

如果您将输入作为字符串,首先,我不确定从何处拆分字段

或者,是否有用于此的scala实用程序? 谢谢
kvd

我找到了答案。countVectorizer输出可以转换为sparseVecor数据类型,该数据类型具有[size、[index]、[value]]。索引和值数组可以压缩并以libsvm格式输出

val countVec=vec(1).作为[SparseVector]的安装

经过进一步的探索,我发现我不需要这种转换。我可以使用classLabel和sparseVector创建一个标记点,并直接传递给机器学习对象

谢谢, kvd