Java 西班牙语文本的apache mahout
有人知道ApacheMahout是否能很好地处理西班牙语文本吗?我需要对西班牙语的报纸文章进行聚类,但没有很多工具可以进行聚类。我认为Mahout是一个很酷的框架,但是它在处理西班牙语文本时好吗?为什么不好?您可以使用bin/mahout脚本的seq2sparse命令,并使用-a选项指定相应的Lucene analyzer org.apache.Lucene.analysis.es.SpanishAnalyzer。见第8章第199-200页。。。在行动手册中的MahoutJava 西班牙语文本的apache mahout,java,apache,mahout,Java,Apache,Mahout,有人知道ApacheMahout是否能很好地处理西班牙语文本吗?我需要对西班牙语的报纸文章进行聚类,但没有很多工具可以进行聚类。我认为Mahout是一个很酷的框架,但是它在处理西班牙语文本时好吗?为什么不好?您可以使用bin/mahout脚本的seq2sparse命令,并使用-a选项指定相应的Lucene analyzer org.apache.Lucene.analysis.es.SpanishAnalyzer。见第8章第199-200页。。。在行动手册中的Mahout 除此之外,您还可以使用
除此之外,您还可以使用现有的分析器编写自己的分析器。本书包含许多示例,您可以找到源代码。非常感谢您提供的信息,我们将对此进行介绍