Text 如何将文本转换为MOA实例?

Text 如何将文本转换为MOA实例?,text,weka,text-classification,moa,Text,Weka,Text Classification,Moa,我正在MOA中为一个文本应用程序进行增量学习。这需要创建一个以数字表示文本的实例对象,例如词汇表中每个词干单词的TF-IDF分数。我的MOA版本是2019.05.0 我在MOA中查找文本处理工具,但找不到 我看到Weka有一个类StringToWordVector,所以我决定试试。Weka的类与MOA的类不同,但有一个名为WekaToSamoaInstanceConverter的类,我想我可以创建一个Weka实例,通过StringToWordVector运行它,然后将其转换为MOA实例。也许这是

我正在MOA中为一个文本应用程序进行增量学习。这需要创建一个以数字表示文本的实例对象,例如词汇表中每个词干单词的TF-IDF分数。我的MOA版本是2019.05.0

我在MOA中查找文本处理工具,但找不到

我看到Weka有一个类
StringToWordVector
,所以我决定试试。Weka的类与MOA的类不同,但有一个名为
WekaToSamoaInstanceConverter
的类,我想我可以创建一个Weka实例,通过
StringToWordVector
运行它,然后将其转换为MOA实例。也许这是错误的轨道,或者这是正确的轨道,我在语法中遗漏了一些东西

公共静态实例convertDirectoryToInstances(字符串目录)引发异常{
//创建从目录中读取培训或测试文件的对象。
//将来,我想一次添加一个文件。这不是我现在担心的部分。
TextDirectoryLoader=新的TextDirectoryLoader();
字符串[]选项=新字符串[]{“-dir”,目录,“-charset”,“UTF-8”};
loader.setOptions(选项);
getStructure();
//创建表示未处理文本的Weka实例。
weka.core.Instances plainTextInstances=loader.getDataSet();
//StringToOrdVector是将文本转换为文本向量的过滤器。
//对于这个例子,我没有使用任何提示,所以我希望每个实例都是文档中的一组术语。
StringToWordVector StringToWordVector=新的StringToWordVector();
setInputFormat(明文实例);
weka.core.Instances wekaWordVectors=Filter.useFilter(明文实例,stringToWordVector);
//MOA实例与Weka实例不同,因此我们需要对其进行转换。
WEKATOSAMOA InstanceConverter转换器=新的WEKATOSAMOA InstanceConverter();
//这就是失败的原因。
Instances=converter.samoa实例(wekaWordVectors);
返回向量;
}
wekaWordVectors.size()
是子目录中的文件数,所以这就是我所期望的

调用
instances()
失败。第220行尝试调用
locateIndex(0)
。0处没有类,因此返回-1。这个-1用作数组索引,因此我得到了一个
ArrayIndexOutOfBoundsException
。我不知道类0是什么意思,但我知道
ArrayIndexOutOfBoundsException
表示我做错了什么